Im Quellenvergleich

Mistral veröffentlicht OCR 4

5 Quellen · 5 Meldungen · Stand 24.06.2026

Alle Inhalte werden von KI erstellt. Dieser Überblick fasst zusammen, worin sich mehrere Quellen einig sind und worin sie sich unterscheiden — die Bewertung bleibt dir überlassen.

Im Quellenvergleich

Worin die Quellen übereinstimmen

Mistral AI hat die Version 4 seiner OCR-Software veröffentlicht. Das Modell extrahiert Text aus PDFs, Word- und PowerPoint-Dateien und gibt zusätzlich Begrenzungsrahmen (Bounding Boxes), eine Klassifizierung der Blöcke (z. B. Titel, Tabellen, Signaturen) sowie Konfidenzwerte pro Wort und Seite aus. Es unterstützt 170 Sprachen und läuft in einem einzelnen Container für den selbstgehosteten Einsatz. In einem manuellen Vergleichstest bevorzugten unabhängige Tester die Ausgabe von OCR 4 in 72 Prozent der Fälle gegenüber der Konkurrenz. Auf dem Benchmark OlmOCRBench erreichte das Modell 85,20 Punkte, auf OmniDocBench 93,07 Punkte. Die API kostet 4 Dollar pro 1.000 Seiten, im Batch-Betrieb 2 Dollar. Die erweiterte Version Document AI kostet 5 Dollar pro 1.000 Seiten.

Worin sie sich unterscheiden

Einschränkungen und WarnhinweiseDie Benchmarks haben bekannte Grenzen: Falsche Referenzannotationen, äquivalente mathematische Notationen oder Probleme mit dem Lesefluss in mehrspaltigen Dokumenten können zu Fehlbewertungen führen.
  • Das Unternehmen rät, das Modell an eigenen Dokumenten zu testen.1
  • Mistral weist darauf hin, dass OCR 4 nicht für medizinische Diagnosen, rechtliche Entscheidungen oder wichtige Finanzentscheidungen geeignet ist.2
  • Mistral selbst warnt vor einer Überschätzung der Benchmark-Werte und räumt Fehler in den Referenzannotationen ein.3
Begründung für die Positionsangabe
  • Die Positionsangabe war laut Unternehmen die am häufigsten gewünschte Funktion.2
  • Die Blockklassifikation soll die automatische Gliederung von Dokumenten für Suchsysteme oder KI-Agenten verbessern.4
  • Mistral bezeichnet die strukturierte Aufteilung als semantisches Chunking, bei dem die Dokumentstruktur über die Aufteilung entscheidet.5
  • Das Angebot richtet sich an regulierte Unternehmen, die sensible Dokumente nicht über US-Cloud-APIs leiten können.3
Verfügbarkeit und Plattformen
  • Das Modell ist über die API, Mistral Studio und Microsoft Foundry verfügbar.4
  • OCR 4 ist über Mistral Studio, Amazon SageMaker und Microsoft Foundry verfügbar.5
  • Die Nutzung über Document AI in Mistral Studio kostet 5 Dollar pro 1.000 Seiten.1
Geopolitischer Kontext und Wettbewerb
  • Nachdem die US-Regierung Anthropic gezwungen hatte, Modelle für ausländische Nutzer zu sperren, sieht Mistral-Chef Arthur Mensch europäische Unternehmen in der Pflicht, eigene KI-Fähigkeiten aufzubauen. OCR 4 sei das Produkt dieser Strategie.3
  • Einen Tag zuvor veröffentlichte Baidu mit Unlimited-OCR ein kostenloses Open-Weight-Modell. Die beiden Releases zeigen den Gegensatz zwischen freier Langzeit-Parsing-Software und kommerzieller Enterprise-Lösung.3

Quellen (5)

Vollständige Übersicht mit allen Meldungen öffnen →