Notebookcheck Logo

Mistral OCR zet complexe documenten nauwkeurig om in bewerkbare bestanden met AI

Mistral OCR gebruikt AI om nauwkeurig afdruk- en PDF-documenten om te zetten in bewerkbare bestanden. (Afbeeldingsbron: Mistral)
Mistral OCR gebruikt AI om nauwkeurig afdruk- en PDF-documenten om te zetten in bewerkbare bestanden. (Afbeeldingsbron: Mistral)
Mistral heeft zijn API voor optische tekenherkenning onthuld voor gebruik door bedrijven om grote hoeveelheden documenten snel en nauwkeurig om te zetten naar bewerkbare digitale bestanden.

Mistral heeft een nieuw product gelanceerd genaamd Mistral OCR, een AI-gestuurde API voor optische tekenherkenning, ontworpen om uit te blinken in het omzetten van gedrukte documenten in digitale bestanden.

Er bestaan miljoenen gedrukte documenten en niet-wijzigbare PDF-bestanden, waaronder oude geboorteakten en boeken. Software voor optische tekenherkenning zet de tekst en lay-out van deze bronmaterialen om in bewerkbare digitale bestanden. Hoewel OCR-software gewone tekstdocumenten gemakkelijk en nauwkeurig converteert, hebben ze vaak moeite met complexe tabellen en grafieken en vreemde talen.

Mistral OCR is speciaal gemaakt voor meertalige, complexe documentconversie. De nauwkeurigheid van Mistral bij tekstconversie in 11 talen varieert van een dieptepunt van 97,00% tot een hoogtepunt van 99,54%, beter dan de prestaties van Microsoft en Google AI OCR-aanbiedingen. De nauwkeurigheid is ook hoger dan geteste concurrenten voor complexe documentconversies, zoals die waarbij wiskunde of tabellen betrokken zijn.

De Mistral OCR API is momenteel beperkt tot geüploade documenten die kleiner zijn dan 50 MB en minder dan 1.000 pagina's lang. Gedrukte documenten moeten eerst gedigitaliseerd worden door scanners zoals deze op Amazon, terwijl PDF-bestanden, afbeeldingen en websites direct verwerkt kunnen worden.

Mistral OCR presteert beter dan concurrenten op complexe documenten. (Afbeeldingsbron: Mistral)
Mistral OCR presteert beter dan concurrenten op complexe documenten. (Afbeeldingsbron: Mistral)
Mistral OCR verwerkt tekstconversie in tientallen talen beter dan concurrenten. (Afbeeldingsbron: Mistral)
Mistral OCR verwerkt tekstconversie in tientallen talen beter dan concurrenten. (Afbeeldingsbron: Mistral)
Er zijn slechts een paar regels Python-code nodig om de Mistral OCR API te gebruiken. (Afbeeldingsbron: Mistral)
Er zijn slechts een paar regels Python-code nodig om de Mistral OCR API te gebruiken. (Afbeeldingsbron: Mistral)
 

Mistral OCR

Maak kennis met 's werelds beste API voor het begrijpen van documenten.

Onderzoek

6 mrt 2025

Mistral AI-team

Door de geschiedenis heen heeft vooruitgang in het abstraheren en terugvinden van informatie de menselijke vooruitgang gestimuleerd. Van hiërogliefen tot papyri, van de drukpers tot digitalisering, elke sprong heeft menselijke kennis toegankelijker en bruikbaarder gemaakt, en verdere innovatie aangewakkerd.

Vandaag staan we aan de vooravond van de volgende grote sprong - het ontsluiten van de collectieve intelligentie van alle gedigitaliseerde informatie. Ongeveer 90% van alle organisatiegegevens ter wereld is opgeslagen in de vorm van documenten, en om dit potentieel te benutten introduceren we Mistral OCR.

Mistral OCR is een API voor optische tekenherkenning die een nieuwe norm stelt voor het begrijpen van documenten. In tegenstelling tot andere modellen, begrijpt Mistral OCR elk element van documenten - media, tekst, tabellen, vergelijkingen - met een ongekende nauwkeurigheid en kennis. Het neemt afbeeldingen en PDF's als invoer en extraheert inhoud in een geordende interleaved tekst en afbeeldingen.

Hierdoor is Mistral OCR een ideaal model om te gebruiken in combinatie met een RAG-systeem dat multimodale documenten (zoals dia's of complexe PDF's) als invoer neemt.

We hebben Mistral OCR gemaakt tot het standaardmodel voor het begrijpen van documenten voor miljoenen gebruikers op Le Chat, en geven de API mistral-ocr-latest vrij voor 1000 pagina's / $ (en ongeveer het dubbele aantal pagina's per dollar met batch-inferentie). De API is vandaag beschikbaar op onze ontwikkelaarssuite la Plateforme, en binnenkort ook voor onze cloud- en inferentiepartners, en on-premises.

Highlights

Geavanceerd begrip van complexe documenten

Meertalig en multimodaal

Eersteklas benchmarks

Snelste in zijn categorie

Doc-als-prompt, gestructureerde uitvoer

Selectief beschikbaar om zelf te hosten voor organisaties die te maken hebben met zeer gevoelige of geclassificeerde informatie

Laten we in elk ervan duiken.

Geavanceerd begrip van complexe documenten

Mistral OCR blinkt uit in het begrijpen van complexe documentelementen, waaronder verweven afbeeldingen, wiskundige uitdrukkingen, tabellen en geavanceerde lay-outs zoals LaTeX-opmaak. Het model maakt een dieper begrip mogelijk van rijke documenten zoals wetenschappelijke papers met grafieken, diagrammen, vergelijkingen en figuren.

Hieronder ziet u een voorbeeld van het model dat zowel tekst als afbeeldingen uit een gegeven PDF in een markdown-bestand extraheert. U kunt het notitieblok hier openen.

Hieronder vindt u zij-aan-zij vergelijkingen van PDF's en hun respectievelijke OCR-uitvoer. Beweeg de schuifregelaar om te schakelen tussen invoer en uitvoer.

Tabellen + Cijfers

3 Voorbeeld

OCR resultaat

3 Ocr

Wiskunde

4 Voorbeeld

OCR resultaat

4 Ocr

Hindi

5 Voorbeeld

OCR resultaat

OCR Hindi

Document

6 Voorbeeld

OCR resultaat

6 Ocr

Arabisch

7 Voorbeeld

OCR resultaat

Arabisch OCR

Eersteklas benchmarks

Mistral OCR heeft het in strenge benchmarktests steeds beter gedaan dan andere toonaangevende OCR-modellen. De superieure nauwkeurigheid in meerdere aspecten van documentanalyse wordt hieronder geïllustreerd. We extraheren ingesloten afbeeldingen uit documenten samen met tekst. De andere LLM's die hieronder worden vergeleken, hebben die mogelijkheid niet. Voor een eerlijke vergelijking evalueren we ze op onze interne "alleen-tekst" testset met verschillende publicaties en PDF's van het web; hieronder:

Model Algemeen Wiskunde Meertalig Gescand Tabellen

Google Document AI 83.42 80.29 86.42 92.77 78.16

Azure OCR 89.52 85.72 87.52 94.65 89.52

Gemini-1.5-Flash-002 90.23 89.11 86.76 94.87 90.48

Gemini-1.5-Pro-002 89.92 88.48 86.33 96.15 89.71

Gemini-2.0-Flash-001 88.69 84.18 85.80 95.11 91.46

GPT-4o-2024-11-20 89,77 87,55 86,00 94,58 91,70

Mistral OCR 2503 94.89 94.29 89.55 98.96 96.12

Van huis uit meertalig

Sinds de oprichting van Mistral streven we ernaar om de wereld te dienen met onze modellen, en daarom streven we naar meertalige mogelijkheden in al onze producten. Mistral OCR tilt dit naar een nieuw niveau, omdat het duizenden scripts, lettertypen en talen van alle continenten kan ontleden, begrijpen en transcriberen. Deze veelzijdigheid is cruciaal voor zowel wereldwijde organisaties die documenten met verschillende taalachtergronden verwerken, als voor hyperlokale bedrijven die nichemarkten bedienen.

Model Fuzzy Match in Generatie

Google-Document-AI 95.88

Gemini-2.0-Flash-001 96.53

Azure OCR 97.31

Mistral OCR 2503 99.02

Benchmarks per taal:

Taal Azure OCR Google Doc AI Gemini-2.0-Flash-001 Mistral OCR 2503

ru 97.35 95.56 96.58 99.09

fr 97.50 96.36 97.06 99.20

hi 96,45 95,65 94,99 97,55

zh 91,40 90,89 91,85 97,11

pt 97,96 96,24 97,25 99,42

de 98,39 97,09 97,19 99,51

es 98,54 97,52 97,75 99,54

tr 95,91 93,85 94,66 97,00

uk 97,81 96,24 96,70 99,29

it 98,31 97,69 97,68 99,42

ro 96,45 95,14 95,88 98,79

Snelste in zijn categorie

De Mistral OCR is lichter dan de meeste modellen in deze categorie, maar presteert beduidend sneller dan zijn collega's. Hij verwerkt tot 2000 pagina's per minuut op één enkel knooppunt. De mogelijkheid om documenten snel te verwerken zorgt voor continu leren en verbetering, zelfs voor omgevingen met een hoge verwerkingscapaciteit.

Doc-as-prompt, gestructureerde uitvoer

Mistral OCR introduceert ook het gebruik van documenten als prompts, waardoor krachtigere en nauwkeurigere instructies mogelijk worden. Met deze mogelijkheid kunnen gebruikers specifieke informatie uit documenten halen en deze opmaken in gestructureerde uitvoer, zoals JSON. Gebruikers kunnen de geëxtraheerde uitvoer koppelen aan downstream functieaanroepen en agents bouwen. Bekijk dit voorbeeldnotitieblok.

Beschikbaar voor zelf hosten op selectieve basis

Voor organisaties met strenge eisen op het gebied van gegevensprivacy biedt Mistral OCR een optie voor zelf-hosting. Dit zorgt ervoor dat gevoelige of geclassificeerde informatie veilig blijft binnen uw eigen infrastructuur, waardoor u voldoet aan de regelgeving en beveiligingsnormen. Als u self-deployment met ons wilt onderzoeken, laat het ons dan weten.

Gebruiksscenario's

Wij stellen onze bètaklanten in staat om hun organisatorische kennis te vergroten door hun uitgebreide documentarchieven om te zetten in acties en oplossingen. Enkele van de belangrijkste gebruikssituaties waarin onze technologie een significante impact heeft:

Digitalisering van wetenschappelijk onderzoek: Toonaangevende onderzoeksinstellingen hebben geëxperimenteerd met Mistral OCR om wetenschappelijke papers en tijdschriften om te zetten in AI-ready formaten, waardoor ze toegankelijk worden voor downstream intelligence engines. Dit heeft meetbaar snellere samenwerking mogelijk gemaakt en wetenschappelijke workflows versneld.

Historisch en cultureel erfgoed bewaren: Organisaties en non-profitorganisaties die erfgoed beheren, gebruiken Mistral OCR om historische documenten en artefacten te digitaliseren, zodat ze bewaard blijven en toegankelijk worden voor een breder publiek.

Klantenservice stroomlijnen: Klantenservice-afdelingen gebruiken Mistral OCR om documentatie en handleidingen om te zetten in geïndexeerde kennis, waardoor de responstijden korter worden en de klanttevredenheid toeneemt.

Literatuur geschikt maken voor ontwerp, onderwijs, juridische zaken, enz. AI-klaar te maken: Mistral OCR helpt bedrijven ook om technische literatuur, technische tekeningen, collegenota's, presentaties, regelgevingsdocumenten en nog veel meer om te zetten in geïndexeerde, antwoordklare formaten, waardoor intelligentie en productiviteit in miljoenen documenten worden ontsloten.

Ervaar het vandaag nog

De OCR-mogelijkheden van Mistral zijn gratis uit te proberen op le Chat. Om de API te proberen, gaat u naar la Plateforme. We ontvangen graag uw feedback; verwacht dat het model de komende weken nog beter zal worden. Als onderdeel van onze strategische engagementprogramma's zullen we op selectieve basis ook on-premises implementatie aanbieden.

Please share our article, every link counts!
Mail Logo
> Overzichten en testrapporten over laptops en mobieltjes > Nieuws > Nieuws Archief > Nieuws archieven 2025 03 > Mistral OCR zet complexe documenten nauwkeurig om in bewerkbare bestanden met AI
David Chien, 2025-03-11 (Update: 2025-03-11)