Mistral heeft een nieuw product gelanceerd genaamd Mistral OCR, een AI-gestuurde API voor optische tekenherkenning, ontworpen om uit te blinken in het omzetten van gedrukte documenten in digitale bestanden.
Er bestaan miljoenen gedrukte documenten en niet-wijzigbare PDF-bestanden, waaronder oude geboorteakten en boeken. Software voor optische tekenherkenning zet de tekst en lay-out van deze bronmaterialen om in bewerkbare digitale bestanden. Hoewel OCR-software gewone tekstdocumenten gemakkelijk en nauwkeurig converteert, hebben ze vaak moeite met complexe tabellen en grafieken en vreemde talen.
Mistral OCR is speciaal gemaakt voor meertalige, complexe documentconversie. De nauwkeurigheid van Mistral bij tekstconversie in 11 talen varieert van een dieptepunt van 97,00% tot een hoogtepunt van 99,54%, beter dan de prestaties van Microsoft en Google AI OCR-aanbiedingen. De nauwkeurigheid is ook hoger dan geteste concurrenten voor complexe documentconversies, zoals die waarbij wiskunde of tabellen betrokken zijn.
De Mistral OCR API is momenteel beperkt tot geüploade documenten die kleiner zijn dan 50 MB en minder dan 1.000 pagina's lang. Gedrukte documenten moeten eerst gedigitaliseerd worden door scanners zoals deze op Amazon, terwijl PDF-bestanden, afbeeldingen en websites direct verwerkt kunnen worden.
Bron(nen)
Mistral OCR
Maak kennis met 's werelds beste API voor het begrijpen van documenten.
Onderzoek
6 mrt 2025
Mistral AI-team
Door de geschiedenis heen heeft vooruitgang in het abstraheren en terugvinden van informatie de menselijke vooruitgang gestimuleerd. Van hiërogliefen tot papyri, van de drukpers tot digitalisering, elke sprong heeft menselijke kennis toegankelijker en bruikbaarder gemaakt, en verdere innovatie aangewakkerd.
Vandaag staan we aan de vooravond van de volgende grote sprong - het ontsluiten van de collectieve intelligentie van alle gedigitaliseerde informatie. Ongeveer 90% van alle organisatiegegevens ter wereld is opgeslagen in de vorm van documenten, en om dit potentieel te benutten introduceren we Mistral OCR.
Mistral OCR is een API voor optische tekenherkenning die een nieuwe norm stelt voor het begrijpen van documenten. In tegenstelling tot andere modellen, begrijpt Mistral OCR elk element van documenten - media, tekst, tabellen, vergelijkingen - met een ongekende nauwkeurigheid en kennis. Het neemt afbeeldingen en PDF's als invoer en extraheert inhoud in een geordende interleaved tekst en afbeeldingen.
Hierdoor is Mistral OCR een ideaal model om te gebruiken in combinatie met een RAG-systeem dat multimodale documenten (zoals dia's of complexe PDF's) als invoer neemt.
We hebben Mistral OCR gemaakt tot het standaardmodel voor het begrijpen van documenten voor miljoenen gebruikers op Le Chat, en geven de API mistral-ocr-latest vrij voor 1000 pagina's / $ (en ongeveer het dubbele aantal pagina's per dollar met batch-inferentie). De API is vandaag beschikbaar op onze ontwikkelaarssuite la Plateforme, en binnenkort ook voor onze cloud- en inferentiepartners, en on-premises.
Highlights
Geavanceerd begrip van complexe documenten
Meertalig en multimodaal
Eersteklas benchmarks
Snelste in zijn categorie
Doc-als-prompt, gestructureerde uitvoer
Selectief beschikbaar om zelf te hosten voor organisaties die te maken hebben met zeer gevoelige of geclassificeerde informatie
Laten we in elk ervan duiken.
Geavanceerd begrip van complexe documenten
Mistral OCR blinkt uit in het begrijpen van complexe documentelementen, waaronder verweven afbeeldingen, wiskundige uitdrukkingen, tabellen en geavanceerde lay-outs zoals LaTeX-opmaak. Het model maakt een dieper begrip mogelijk van rijke documenten zoals wetenschappelijke papers met grafieken, diagrammen, vergelijkingen en figuren.
Hieronder ziet u een voorbeeld van het model dat zowel tekst als afbeeldingen uit een gegeven PDF in een markdown-bestand extraheert. U kunt het notitieblok hier openen.
Hieronder vindt u zij-aan-zij vergelijkingen van PDF's en hun respectievelijke OCR-uitvoer. Beweeg de schuifregelaar om te schakelen tussen invoer en uitvoer.
Tabellen + Cijfers
3 Voorbeeld
OCR resultaat
3 Ocr
Wiskunde
4 Voorbeeld
OCR resultaat
4 Ocr
Hindi
5 Voorbeeld
OCR resultaat
OCR Hindi
Document
6 Voorbeeld
OCR resultaat
6 Ocr
Arabisch
7 Voorbeeld
OCR resultaat
Arabisch OCR
Eersteklas benchmarks
Mistral OCR heeft het in strenge benchmarktests steeds beter gedaan dan andere toonaangevende OCR-modellen. De superieure nauwkeurigheid in meerdere aspecten van documentanalyse wordt hieronder geïllustreerd. We extraheren ingesloten afbeeldingen uit documenten samen met tekst. De andere LLM's die hieronder worden vergeleken, hebben die mogelijkheid niet. Voor een eerlijke vergelijking evalueren we ze op onze interne "alleen-tekst" testset met verschillende publicaties en PDF's van het web; hieronder:
Model Algemeen Wiskunde Meertalig Gescand Tabellen
Google Document AI 83.42 80.29 86.42 92.77 78.16
Azure OCR 89.52 85.72 87.52 94.65 89.52
Gemini-1.5-Flash-002 90.23 89.11 86.76 94.87 90.48
Gemini-1.5-Pro-002 89.92 88.48 86.33 96.15 89.71
Gemini-2.0-Flash-001 88.69 84.18 85.80 95.11 91.46
GPT-4o-2024-11-20 89,77 87,55 86,00 94,58 91,70
Mistral OCR 2503 94.89 94.29 89.55 98.96 96.12
Van huis uit meertalig
Sinds de oprichting van Mistral streven we ernaar om de wereld te dienen met onze modellen, en daarom streven we naar meertalige mogelijkheden in al onze producten. Mistral OCR tilt dit naar een nieuw niveau, omdat het duizenden scripts, lettertypen en talen van alle continenten kan ontleden, begrijpen en transcriberen. Deze veelzijdigheid is cruciaal voor zowel wereldwijde organisaties die documenten met verschillende taalachtergronden verwerken, als voor hyperlokale bedrijven die nichemarkten bedienen.
Model Fuzzy Match in Generatie
Google-Document-AI 95.88
Gemini-2.0-Flash-001 96.53
Azure OCR 97.31
Mistral OCR 2503 99.02
Benchmarks per taal:
Taal Azure OCR Google Doc AI Gemini-2.0-Flash-001 Mistral OCR 2503
ru 97.35 95.56 96.58 99.09
fr 97.50 96.36 97.06 99.20
hi 96,45 95,65 94,99 97,55
zh 91,40 90,89 91,85 97,11
pt 97,96 96,24 97,25 99,42
de 98,39 97,09 97,19 99,51
es 98,54 97,52 97,75 99,54
tr 95,91 93,85 94,66 97,00
uk 97,81 96,24 96,70 99,29
it 98,31 97,69 97,68 99,42
ro 96,45 95,14 95,88 98,79
Snelste in zijn categorie
De Mistral OCR is lichter dan de meeste modellen in deze categorie, maar presteert beduidend sneller dan zijn collega's. Hij verwerkt tot 2000 pagina's per minuut op één enkel knooppunt. De mogelijkheid om documenten snel te verwerken zorgt voor continu leren en verbetering, zelfs voor omgevingen met een hoge verwerkingscapaciteit.
Doc-as-prompt, gestructureerde uitvoer
Mistral OCR introduceert ook het gebruik van documenten als prompts, waardoor krachtigere en nauwkeurigere instructies mogelijk worden. Met deze mogelijkheid kunnen gebruikers specifieke informatie uit documenten halen en deze opmaken in gestructureerde uitvoer, zoals JSON. Gebruikers kunnen de geëxtraheerde uitvoer koppelen aan downstream functieaanroepen en agents bouwen. Bekijk dit voorbeeldnotitieblok.
Beschikbaar voor zelf hosten op selectieve basis
Voor organisaties met strenge eisen op het gebied van gegevensprivacy biedt Mistral OCR een optie voor zelf-hosting. Dit zorgt ervoor dat gevoelige of geclassificeerde informatie veilig blijft binnen uw eigen infrastructuur, waardoor u voldoet aan de regelgeving en beveiligingsnormen. Als u self-deployment met ons wilt onderzoeken, laat het ons dan weten.
Gebruiksscenario's
Wij stellen onze bètaklanten in staat om hun organisatorische kennis te vergroten door hun uitgebreide documentarchieven om te zetten in acties en oplossingen. Enkele van de belangrijkste gebruikssituaties waarin onze technologie een significante impact heeft:
Digitalisering van wetenschappelijk onderzoek: Toonaangevende onderzoeksinstellingen hebben geëxperimenteerd met Mistral OCR om wetenschappelijke papers en tijdschriften om te zetten in AI-ready formaten, waardoor ze toegankelijk worden voor downstream intelligence engines. Dit heeft meetbaar snellere samenwerking mogelijk gemaakt en wetenschappelijke workflows versneld.
Historisch en cultureel erfgoed bewaren: Organisaties en non-profitorganisaties die erfgoed beheren, gebruiken Mistral OCR om historische documenten en artefacten te digitaliseren, zodat ze bewaard blijven en toegankelijk worden voor een breder publiek.
Klantenservice stroomlijnen: Klantenservice-afdelingen gebruiken Mistral OCR om documentatie en handleidingen om te zetten in geïndexeerde kennis, waardoor de responstijden korter worden en de klanttevredenheid toeneemt.
Literatuur geschikt maken voor ontwerp, onderwijs, juridische zaken, enz. AI-klaar te maken: Mistral OCR helpt bedrijven ook om technische literatuur, technische tekeningen, collegenota's, presentaties, regelgevingsdocumenten en nog veel meer om te zetten in geïndexeerde, antwoordklare formaten, waardoor intelligentie en productiviteit in miljoenen documenten worden ontsloten.
Ervaar het vandaag nog
De OCR-mogelijkheden van Mistral zijn gratis uit te proberen op le Chat. Om de API te proberen, gaat u naar la Plateforme. We ontvangen graag uw feedback; verwacht dat het model de komende weken nog beter zal worden. Als onderdeel van onze strategische engagementprogramma's zullen we op selectieve basis ook on-premises implementatie aanbieden.
Top 10 Testrapporten
» Top 10 Multimedia Notebooks
» Top 10 Gaming-Notebooks
» Top 10 Budget Gaming Laptops
» Top 10 Lichtgewicht Gaming-Notebooks
» Top 10 Premium Office/Business-Notebooks
» Top 10 Budget Office/Business-Notebooks
» Top 10 Workstation-Laptops
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Notebooks tot €300
» Top 10 Notebooks tot €500
» Top 10 Notebooks tot € 1.000De beste notebookbeeldschermen zoals getest door Notebookcheck
» De beste notebookbeeldschermen
» Top Windows Alternatieven voor de MacBook Pro 13
» Top Windows Alternatieven voor de MacBook Pro 15
» Top Windows alternatieven voor de MacBook 12 en Air
» Top 10 best verkopende notebooks op Amazon
» Top 10 Convertible Notebooks
» Top 10 Tablets
» Top 10 Tablets tot € 250
» Top 10 Smartphones
» Top 10 Phablets (>90cm²)
» Top 10 Camera Smartphones
» Top 10 Smartphones tot €500
» Top 10 best verkopende smartphones op Amazon