Deepseeks neuer Chatbot bietet eine beeindruckende Einführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese KI, ein Produkt des chinesischen Startups Deepseek, ist schnell zu einem wichtigen Spieler geworden und hat sogar zu einem erheblichen Rückgang des Nvidia -Aktienkurs beigetragen.
Der Erfolg von Deepseek beruht auf seinen innovativen Architektur- und Trainingsmethoden. Schlüsseltechnologien umfassen:
- Multi-Tooken-Vorhersage (MTP): Vorhersage mehrerer Wörter gleichzeitig, Steigerung der Genauigkeit und Effizienz.
- Mischung von Experten (MOE): Nutzung von 256 neuronalen Netzwerken (acht aktiviertes pro Token), Beschleunigung der Schulungen und Verbesserung der Leistung.
- Multi-Head Latent Achtung (MLA): Wiederholtes Extrahieren von Schlüsseldetails aus dem Text und sicherstellen, dass wichtige Informationen nicht übersehen werden.
Während Deepseek zunächst einen bemerkenswert niedrigen Schulungskosten von 6 Millionen US -Dollar für Deepseek V3 unter Verwendung von 2048 GPUs beanspruchte, ergab die semianalyse eine weitaus umfangreichere Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs (einschließlich 10.000 H800, 10.000 H100 und zusätzliches H20 -GPUs). Dies führt zu einer Gesamtinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten, die auf 944 Mio. USD geschätzt werden.
Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, besitzt seine Rechenzentren und bietet Kontrolle über Optimierung und schnellere Innovationsimplementierung. Die selbstfinanzierte Natur verbessert die Flexibilität und die Entscheidungsgeschwindigkeit. Das Unternehmen zieht auch Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen und hauptsächlich von führenden chinesischen Universitäten rekrutieren.
Die anfängliche Zahl von Deepseeks in Höhe von 6 Millionen US-Dollar entspricht nur der GPU-Kosten vor der Ausbildung, ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Die Gesamtinvestition des Unternehmens in die KI -Entwicklung beträgt 500 Millionen US -Dollar. Die magere Struktur ermöglicht jedoch eine effiziente Implementierung von Innovationen im Vergleich zu größeren, bürokratischeren Unternehmen.
Der Erfolg von Deepseek unterstreicht das Potenzial gut finanzierter unabhängiger KI-Unternehmen, mit Branchenriesen zu konkurrieren. Die Erfolge basieren jedoch in erheblichen Investitionen, technologischen Durchbrüchen und einem starken Team. Der Anspruch auf Modellentwicklung "revolutionärer Budget" ist daher eine zu vereinfachte Vereinfachung. Dennoch bleiben die Kosten deutlich niedriger als die Konkurrenten. Zum Beispiel kostete das Trainer von Deepseeks R1 -Modell 5 Millionen US -Dollar im Vergleich zu 100 Millionen US -Dollar von ChatGPT4.