Im Quellenvergleich

Google Gemini 3.5 Flash Update

5 Quellen · 5 Meldungen · Stand 25.06.2026

Alle Inhalte werden von KI erstellt. Dieser Überblick fasst zusammen, worin sich mehrere Quellen einig sind und worin sie sich unterscheiden — die Bewertung bleibt dir überlassen.

Im Quellenvergleich

Worin die Quellen übereinstimmen

Google hat die Funktion "Computer Use" als integriertes Werkzeug in das KI-Modell Gemini 3.5 Flash aufgenommen. Die Funktion ermöglicht es der KI, Bildschirminhalte zu erfassen und eigenständig Aktionen wie Mausklicks, Tastatureingaben oder das Ausfüllen von Formularen auszuführen. Entwickler können damit KI-Agenten für Browser-, Mobil- und Desktop-Umgebungen erstellen. Bisher war diese Fähigkeit nur als separates Modell verfügbar. Google hat Sicherheitsmaßnahmen implementiert, darunter ein optionales System, das eine Nutzerbestätigung vor sensiblen Aktionen verlangt, und ein weiteres, das Aufgaben bei erkannten Prompt-Injection-Angriffen automatisch stoppt. Die Funktion ist über die Gemini-API und die Gemini Enterprise Agent Platform verfügbar.

Worin sie sich unterscheiden

Anwendungsbereiche der Computer-Use-Funktion
  • Die Funktion eignet sich besonders für automatisierte Softwaretests und das Erstellen von Dokumentationen.1
  • Der Fokus liegt zunächst auf dem Unternehmensumfeld, etwa für Prozessautomatisierung oder Softwaretests.2
  • Vorgesehene Einsatzbereiche sind Softwaretests und die Automatisierung von Büroarbeit.3
  • Entwickler können mit der nativen Funktion Agenten bauen, die über verschiedene Umgebungen hinweg agieren, etwa für Software-Testing oder Wissensarbeit.4
Sicherheitsmaßnahmen und Empfehlungen
  • Der Hersteller setzt auf gezieltes adversariales Training, um Sicherheitsrisiken wie Prompt-Injection zu mindern.5
  • Die optionalen Sicherheitsmechanismen sind nicht standardmäßig aktiviert.2
  • Der Hersteller empfiehlt, diese Funktionen mit Sandboxing und menschlicher Kontrolle zu kombinieren.5
  • Das Unternehmen rät von der Nutzung für wichtige oder irreversible Aufgaben ab.3
Schwächen und Einschränkungen
  • Das System hat noch Schwächen bei unvorhersehbaren Situationen wie CAPTCHAs oder Pop-ups.2
  • Die KI könnte unglaubwürdigen Anweisungen folgen oder Ziele missverstehen.3
  • Die Funktion befindet sich im Preview-Stadium und ist laut Google fehleranfällig.3
Wettbewerb und Positionierung
  • Das Feature konkurriert mit der Anthropic-Lösung Claude Computer Use, die bereits breiter mit Betriebssystemen interagiert.2
  • Im OSWorld-Benchmark erreicht Gemini 3.5 Flash einen Wert von 78,4 und übertrifft damit das Vorgängermodell Gemini 3 Flash (65,1) sowie GPT-5.4 mini (72,1).4
  • Knapp dahinter liegt GPT-5.5 mit 78,7, während Anthropics Opus 4.8 mit 83,4 den Spitzenwert hält.4

Quellen (5)

Vollständige Übersicht mit allen Meldungen öffnen →