DeepSeek: Mehr als nur ein Hype? Eine tiefe Analyse
Shownotes
Was ist Deep Seek R1?´
Ein KI-Modell aus China, bekannt für Effizienz und niedrige Kosten. Vergleichbar mit einem "Sputnik-Moment" in der KI. KI-Grundlagen werden in Frage gestellt.
Die Technologie Distilled Model: Basiert auf bestehenden Modellen (z.B. ChatGPT). Mix of Experts: Spezialisierte Modelle für verschiedene Aufgaben. Rule-based Reinforcement Learning: Selbstoptimierung mit Belohnungen, besonders bei klaren Ergebnissen. Eigene Software: Nutzt keine CUDA Software sondern 8-Bit Algorithmen. Effizienz: Trainingsmethode ist um Faktor 10 effizienter. Kosten und Ressourcen Behauptete Kosten: 5,5 Millionen Dollar für V3-Modell. GPU-Nutzung: Vermutlich H100 GPUs (bis zu 50.000) genutzt, nicht nur H800. Intransparente Ressourcen und Kosten.
Auswirkungen auf die USA Panik an der Börse, Nvidia verlor an Wert. Jevons Paradox: Mehr Effizienz = mehr KI-Anwendungen. Amazon könnte profitieren.
Auswirkungen auf Europa Open Source bietet Chancen für eigene Applikationen. Möglichkeiten für kleinere Unternehmen und Startups. Strukturen für Innovation und Kapital fehlen noch. Bildungssystem wichtiger Ansatzpunkt. Bedenken: Daten könnten nach China gehen.
Die Zukunft der KI Große Tech-Unternehmen (Google, Microsoft) werden das Rennen machen. Foundation Models werden Commodity und Open Source. Die USA und China werden eigene Modelle haben. Indien könnte eine Überraschung sein.
Video von Sascha Pallenberg: https://www.youtube.com/watch?v=PJEZWMhmMhU
Neuer Kommentar