Meta lanceert Llama 4: team van experts voor meer efficiëntie

Meta lanceert Llama 4: team van experts voor meer efficiëntie

Meta lanceert Llama 4 aan de hand van twee modellen: Maverick en Scout. De nieuwe LLM’s moeten net als hun voorgangers slimme chatbots en generatieve AI-assistenten aansturen.

Meta breidt zijn Llama-ecosysteem uit met de introductie van Llama 4 Scout en Llama 4 Maverick. Beide modellen zijn getraind met een mixture-of-experts (MoE)-architectuur, waarbij slechts een deel van de parameters actief is bij een invoer. Slechts een deel van het model gaan aan de slag met specifieke invoer in de plaats van het hele model. Denk aan de klassieke weergave van het brein, onderverdeeld in gespecialiseerde zones. Die aanpak maakt de modellen efficiënter bij gebruik, zonder in te boeten op prestaties.

Llama 4 Scout is ontworpen voor algemene toepassingen en beschikt over zeventien miljard actieve parameters verdeeld over zestien ‘experts’. Het model kan werken met een contextvenster tot 10 miljoen tokens. Daarmee is het geschikt voor toepassingen zoals uitgebreide samenvattingen en code-analyse.

Meer experts, meer efficiëntie

Llama 4 Maverick bevat eveneens zeventien miljard actieve parameters, maar verdeeld over 128 experts. Het model bereikt prestaties die vergelijkbaar zijn met grotere modellen zoals DeepSeek v3, maar met minder actieve parameters. Meta positioneert het als model voor geavanceerde assistententaken, waaronder redeneren, coderen en multimodale interactie.

Beide modellen passen op een enkele Nvidia H100-GPU. Dat is belangrijk voor de efficiëntie uitrol van de modellen voor inferentie in datacenters.

Behemoth

Als basis voor deze modellen ontwikkelde Meta ook Llama 4 Behemoth. Dat is een model met 288 miljard actieve parameters. Behemoth is nog in training en wordt gebruikt als leermodel voor de kleinere Llama 4-modellen. Behemoth verslaat GPT-4.5 en Claude Sonnet 3.7 op STEM-gerelateerde benchmarks, aldus Meta.

Meta benadrukt dat de Llama 4-modellen gebouwd zijn met rekening houdend met veiligheid. Het bedrijf biedt tools zoals Llama Guard en Prompt Guard aan om ontwikkelaars te helpen ongewenste invoer en uitvoer te detecteren. Verder werd het red-teamingproces uitgebreid met Generative Offensive Agent Testing (GOAT) om potentiële risico’s beter in kaart te brengen.

Llama 4 Scout en Maverick zijn vanaf nu beschikbaar via llama.com en Hugging Face. De modellen zijn (min of meer) open source beschikbaar. Iedereen kan er mee aan de slag, maar commerciële entiteiten die meer dan 700 miljoen maandelijkse actieve gebruikers hebben, moeten wel toestemming vragen aan Meta.  

Meta plant verdere ondersteuning via cloudplatformen en partners. De modellen draaien al in WhatsApp, Messenger en Instagram Direct, maar dan in hoofdzaak buiten Europa. In de VS is de AI-implementatie in de Meta-diensten al alomtegenwoordig, en Meta werkt aan de bredere (ongevraagde) uitrol van AI in WhatsApp in de EU.