Im Quellenvergleich
Worin die Quellen übereinstimmen
DeepSeek hat das Framework DSpark veröffentlicht, das die Antwortgeschwindigkeit von KI-Modellen beschleunigen soll. DSpark nutzt spekulative Dekodierung: Ein kleineres Modell schätzt mehrere nächste Textteile voraus, ein größeres Modell prüft diese gebündelt. Eine semi-autoregressive Methode erlaubt die Ausgabe kleiner Token-Blöcke statt einzelner Token. Ein konfidenzbasiertes Planungssystem passt den Verifikationsaufwand dynamisch an die Rechenlast an.
Worin sie sich unterscheiden
Lizenz und Verfügbarkeit- Das Framework ist unter der MIT-Lizenz veröffentlicht.1
- Der Quellcode ist auf GitHub und Hugging Face verfügbar.1
Leistungssteigerung in Produktionstests- In Produktionstests steigerte DSpark den Durchsatz von DeepSeek-V4-Flash um 51 Prozent und von DeepSeek-V4-Pro um 52 Prozent.1
- Die Generierungsgeschwindigkeit pro Nutzer stieg um 60 bis 85 Prozent (V4-Flash) beziehungsweise 57 bis 78 Prozent (V4-Pro) im Vergleich zur bisherigen Methode MTP-1.1
Offline-Testergebnisse- Offline-Tests mit Modellen wie Qwen3 und Gemma4 zeigten eine um bis zu 30 Prozent höhere Akzeptanzrate der vorausgesagten Textteile als frühere Verfahren.1
Kompatibilität mit anderen Modellen- Das Framework ist nicht auf DeepSeek-Modelle beschränkt, sondern kann auch auf andere offene Modelle wie Qwen oder Gemma angewendet werden.1