De ontwikkeling van het nieuwe DeepSeek-model verloopt niet van een leien dakje. Het model wordt getraind op Huawei Ascend-chips die zich niet betrouwbaar tonen.
Begin dit jaar verbaasde DeepSeek de wereld met het efficiëntie R1-model, maar opvolger R2 laat op zich wachten. Moeilijkheden tijdens de trainingsfase hebben ervoor gezorgd dat DeepSeek de release van het model heeft moeten uitstellen. Onder druk van de Chinese overheid maakt DeepSeek gebruikt van Huawei-chips, maar die laten het afweten.
DeepSeek R2 zou eigenlijk al in de lente het levenslicht moeten hebben gezien. De lancering is uitgesteld omdat het Chinese bedrijf wegens de exportbeperkingen moeilijk aan krachtige Nvidia-hardware geraakte. DeepSeek schakelde noodgedwongen over op Huawei.
Falende chips
De training op de Huawei Ascend-GPU’s verliep echter moeizaam, bevestigen verschillende bronnen aan ArsTechnica. DeepSeek slaagde er nauwelijks in om stabiele trainingcycli te laten draaien op de chips. In die mate dat DeepSeek nadrukkelijk blijft zoeken naar Nvidia-chips voor de training en enkel inferentie op Huawei-apparatuur zou willen laten draaien.
De Chinese overheid moeit zich echter ook met de zaken en wil dat Chinese technologiebedrijven geen chips meer aankopen bij Amerikaanse bedrijven. Huawei stuurde een interventieteam ter plaatse om het probleem te verhelpen. Chinese media blijven overtuigd dat de lancering van DeepSeek R2 niet lang meer op zich zal laten wachten.
Gevangen tussen twee vuren
De moeilijkheden van DeepSeek zijn illustratief voor de positie van Chinese technologiespelers, die gevangen zitten tussen twee vuren. Door exportrestricties geraken ze moeilijk aan buitenlandse chiptechnologie, maar op een eerste Chinese ‘wonderchip’ is het voorlopig ook nog wachten.
Niet alleen zijn de Chinese chips minder krachtig dan wat Nvidia te bieden heeft, ze missen bovendien ook ondersteuning voor het Cuda-ecosysteem, het geheime wapen van Nvidia. Dat maakt een ‘eigen chips eerst’-strategie niet interessant voor een bedrijf als DeepSeek dat wil meespelen op het globale AI-toneel. Nvidia wil de Chinese markt zelf ook niet loslaten en deed een ‘verzoeningsoffer’ aan de Amerikaanse overheid.
Het nieuwe model dreigt aan relevantie in te boeten ten opzichte van nieuwe modellen zoals GPT-5. Bijkomende moeilijkheid voor DeepSeek is dat het met scheve ogen bekeken wordt door Europese autoriteiten.
lees ook