Microsoft lanceert wiskundig taalmodel Phi-4 met 14 miljard parameters

Microsoft breidt zijn Phi-familie uit met een nieuw model, Phi-4. Dit kleine taalmodel zou geschikt zijn voor wiskundige vraagstukken en telt veertien miljard parameters.

Het nieuwste taalmodel in de Phi-familie is bekend: Phi-4. Dit kleine taalmodel blinkt uit in complexe redeneertaken zoals wiskundige vraagstukken, volgens een blogpost van Microsoft. Het model is getraind op ‘synthetische datasets van hoge kwaliteit’ en zou zelfs beter presteren dan modellen waaronder Llama, GPT-4o of Gemini Pro 1.5. Phi-4 is beschikbaar op Azure AI Foundry.

Wiskundig redeneren

Het nieuwe Phi-4-taalmodel van Microsoft is de opvolger van Phi-3-mini, dat slechts 3,8 miljard parameters telde. Voor Phi-4 schaalde Microsoft op met maar liefst 14 miljard parameters. Het model zou voornamelijk uitblinken in het oplossen van wiskundige problemen en beter scoren dan alternatieve taalmodellen, waaronder Llama, GPT-4o en zelfs Gemini Pro 1.5 of Claude 3.5 Sonnet.

“Phi-4 presteert beter dan vergelijkbare en grotere modellen op het gebied van wiskundig redeneren dankzij de vooruitgang in de processen, waaronder het gebruik van hoogwaardige synthetische datasets, curatie van hoogwaardige organische gegevens en innovaties na de training. Phi-4 blijft de grens van grootte versus kwaliteit verleggen”, aldus Microsoft. Het bedrijf geeft niet meer details prijs dan dat het getraind is op ‘synthetische datasets van hoge kwaliteit’. Het model is beschikbaar op Azure AI Foundry.