| Inhalt | KI-Portale |
DeepSeek (Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.) ist ein chinesisches KI-Unternehmen mit Sitz in Hangzhou, gegründet 2023.
Das Unternehmen entwickelt grosse Sprachmodelle (Large Language Models, LLMs) und zielt darauf ab, leistungsfähige Modelle mit niedrigeren Kosten bereitzustellen.
DeepSeek wird finanziert vom chinesischen Hedgefonds High-Flyer, welcher eng mit den Gründern verbunden ist.
DeepSeek nutzt Mixture-of-Experts (MoE)-Techniken, um Modelle effizienter zu machen und Ressourcen zu reduzieren.
Es gibt mehrere Modellversionen / Modellreihen, z. B. DeepSeek-R1, DeepSeek-V3, Coder-Modelle, etc.
Der neuere Ansatz „Sparse Attention“ wird in Experimentiermodellen eingesetzt, um Rechenkosten zu senken und längere Kontextverarbeitung effizienter zu gestalten.
DeepSeek-Modelle haben grosse Kontextfenster (für lange Texte) und sind auf rationale Aufgaben, Programmierung, Strukturierung etc. ausgerichtet. ([Financialounge.com][4])
DeepSeek kann wie andere LLMs eingesetzt werden für Aufgaben wie: Textgenerierung, Dialogsysteme, Frage-Antwort-Systeme oder Assistenzfunktionen.
DeepSeek bietet einen API-Zugang, womit seine Modelle in andere Anwendungen integriert werden können.
Das Unternehmen senkt gezielt die Kosten der Modellausführung / Nutzung (beispielsweise Preissenkungen) zur Erhöhung der Wettbewerbsfähigkeit.
DeepSeek hat auch Modelle / Komponenten für Programmierunterstützung (Coder-Modelle) und Aufgaben im Bereich Logik / Mathematik.
Die Modelle von DeepSeek zeigen laut Forschung Sicherheits- und Ausrichtungsprobleme — z. B. algorithmische Verzerrungen, „safe content“-Schwächen, Zensuranforderungen.
DeepSeek-Modelle unterliegen Informationsunterdrückung oder Zensurmechanismen, insbesondere bei politisch sensiblen Themen — Inhalte in der internen Verarbeitung („chain-of-thought“) können später verändert oder weggelassen werden.
Datenschutz- und Regulierungskritik ausserhalb Chinas: In Deutschland wurde DeepSeek von Datenschutzbehörden gemeldet wegen möglicher Verstösse gegen die DSGVO.
Da DeepSeek stark in China operiert, gelten dortige Richtlinien und politische Rahmenbedingungen, die Einfluss auf Inhalte und Freiheit der Modellantworten haben.
[1] DeepSeek – Offizielle Homepage / überblick
[4] Reuters - “China’s DeepSeek releases ‘intermediate’ AI model on route to next generation”
[9] themalaysianreserve - “What is China’s DeepSeek and why is it freaking out the AI world?”
| Inhalt | KI-Portale |