Im Quellenvergleich

Gemma 4 12B Modell vorgestellt

5 Quellen · 5 Meldungen · Stand 23.06.2026

Alle Inhalte werden von KI erstellt. Dieser Überblick fasst zusammen, worin sich mehrere Quellen einig sind und worin sie sich unterscheiden — die Bewertung bleibt dir überlassen.

Im Quellenvergleich

Worin die Quellen übereinstimmen

Google hat das offene KI-Modell Gemma 4 12B veröffentlicht. Es verarbeitet Text, Bilder und Audio und läuft laut Unternehmen auf handelsüblichen Notebooks mit 16 Gigabyte Arbeitsspeicher. Das Modell ist unter der Apache-2.0-Lizenz veröffentlicht und über Hugging Face herunterladbar.

Worin sie sich unterscheiden

Art der Audio- und BildverarbeitungDas Modell verzichtet auf separate Encoder und verarbeitet Bilder und Audio direkt im Sprachmodell.1 2 3

Das Modell nutzt für Bilder ein leichtes Einbettungsmodul und projiziert Audiosignale direkt in den Text-Token-Raum.4

Leistungsvergleich mit dem 26B-Modell

In Benchmarks erreicht das 12B-Modell fast die Werte des größeren 26B-Modells: Im GPQA Diamond erzielt es 78,8 Prozent (26B: 82,3 Prozent), im MMLU Pro 77,2 Prozent (26B: 82,6 Prozent). Damit übertrifft es die Vorgängerversion Gemma 3 27B.4
Laut Herstellerangaben ist es in Benchmarks fast genauso leistungsfähig wie das 26B-Modell.5
Es erreicht in Benchmarks fast die Leistung des doppelt so großen 26B-Modells.1
Laut Google erreicht es in Benchmarks fast die Leistung des größeren Modells.2
Laut Google erreicht es eine Leistung nahe des größeren 26B-Modells, benötigt aber weniger Speicher.3

Verfügbarkeit über zusätzliche PlattformenDas Modell ist über Hugging Face und Kaggle herunterladbar.4 1

Entwickler können es unter anderem über Hugging Face herunterladen.3

Einordnung in die Gemma-4-Reihe

Das Unternehmen schließt damit eine Lücke in der Gemma-4-Reihe, die im April mit vier Modellen startete. Die bisherigen Modelle waren entweder für Mobilgeräte optimiert (E2B, E4B) oder für anspruchsvolle Aufgaben gedacht (26B Mixture of Experts, 31B Dense). Das 12B-Modell ist leistungsfähiger als die mobilen Versionen, benötigt aber keine teuren KI-Beschleuniger.5
Innerhalb der Gemma-4-Familie liegt das 12B-Modell zwischen den Edge-Varianten für Smartphones und dem größeren 26B-Modell.2

Fähigkeit zur Videoanalyse

Das Modell beherrscht unter anderem Spracherkennung, Codegenerierung und Videoanalyse. Laut Developer Guide kann es mehrminütige Videoclips analysieren, indem es Einzelbilder und Audiospur gemeinsam auswertet.1

Leistung ohne dedizierte GPU

Ohne dedizierte GPU verlängern sich die Rechenzeiten jedoch.2

Quellen (5)

Einführung von Gemma 4 12B: Ein einheitliches, encoderfreies multimodales Modell — google_deepmind
„Gemma 4 12B“ erscheint – Multimodales Modell, das auch auf Notebooks mit 16 GB RAM läuft — itmedia_ai
Googles neues Gemma 4 12B-Modell ist dafür ausgelegt, auf jedem Laptop mit 16 GB RAM zu laufen. — ars_technica
Google bringt ein 12-Milliarden-Parameter-Modell auf den Laptop — heise_ki
Googles Gemma 4 12B bringt multimodale KI mit Text, Bild und Audio auf handelsübliche Laptops — the_decoder

Vollständige Übersicht mit allen Meldungen öffnen →