DeepSeek: ‘Nieuw gedistilleerd model kan op slechts één GPU draaien’

DeepSeek logo smartphone

DeepSeek heeft een kleinere versie uitgebracht van zijn R1-model dat maar één GPU nodig heeft om te kunnen werken.

De nieuwe gedistilleerde versie van het R1-model, genaamd DeepSeek-R1-0528-Qwen3-8B, scoort volgens het Chinese AI-bedrijf beter dan vergelijkbare modellen op sommige benchmarks. Het is gebouwd met het Qwen3-8B-model van Alibaba als basis.

Minder rekenkracht

DeepSeek beweert dat dit model beter scoort dan Gemini 2.5 en Phi-4-Reasoning op wiskundige benchmarks. Kleinere modellen zijn vaak minder capabel dan de ‘normale’ versies, maar ze vereisen ook een pak minder rekenkracht. Volgens cloudplatform NodeShift heeft dit model maar één GPU met tussen 40 GB en 80 GB RAM nodig om te kunnen werken. Ter vergelijking: het normale R1-model heeft ongeveer 80 GPU’s nodig.

Het model is getraind met gegeneerde tekst van het recent geüpdatete R1-model. DeepSeek stelt dat dit model een lager hallucinatiepercentage heeft, een uitgebreide ondersteuning voor functieaanroepen en een betere ervaring met coderen.

Niet iedereen is fan van de Chinese AI-technologie. Zowel de Belgische als de Amerikaanse overheid verbiedt zijn personeel om DeepSeek te gebruiken en de app zou zelfs in de VS geweerd worden uit de appwinkels van Google en Apple. Het bedrijf zou het ook niet zo nauw nemen met beveiliging en privacy.

lees ook

Nieuw DeepSeek-model kan moeilijke wiskundige bewijzen oplossen