OpenAI introduceert GPT-4.1-modellen met focus op codering

openai

OpenAI lanceert drie nieuwe GPT-4.1-modellen via zijn API, die zouden uitblinken op gebied van coderen. Het grootste AI-model tot nu toe, GPT-4.5, moet plaatsmaken en wordt afgebouwd in de API.

OpenAI heeft drie nieuwe GPT-4.1-modellen beschikbaar gemaakt via zijn API. De modellen presteren beter dan hun voorgangers op vlak van codering, instructievolging en het verwerken van lange contexten. Ontwikkelaars krijgen met GPT-4.1 toegang tot hogere prestaties aan lagere kosten. Tegelijkertijd kondigt het bedrijf de afbouw van zijn grootste AI-model GPT-4.5 uit de API aan. GPT-4.1 dient zich dan ook aan als waardige vervanger.  

Verbeterde prestaties

De nieuwe modellen zijn GPT-4.1, GPT-4.1 mini en GPT-4.1 nano. Alle drie ondersteunen ze contextvensters tot 1 miljoen tokens. Dat betekent dat ze grotere hoeveelheden tekst en code kunnen verwerken, wat interessant is voor onder meer juridische, technische en financiële toepassingen. Volgens OpenAI toont GPT-4.1 op benchmarks betere prestaties dan GPT-4o en GPT-4.5.

SWE-benchmark. Bron: OpenAI

Op de SWE-benchmark, die meet hoe goed een model programmeertaken uitvoert, haalt GPT-4.1 een score van 54,6 procent. Dat is 21,4 procentpunten hoger dan GPT-4o. Ook bij het volgen van instructies toont GPT-4.1 zich betrouwbaarder. Het model scoorde 38,3 procent op de MultiChallenge-benchmark, een stijging van 10,5 procentpunten ten opzichte van GPT-4o.

GPT-4.1 mini biedt gelijkaardige prestaties aan als GPT-4o, maar tegen lagere kosten en met een lagere latentie. GPT-4.1 nano richt zich op snelheid en efficiëntie. Het model is geschikt voor lichtere taken zoals tekstclassificatie of automatische aanvulling, en is het goedkoopste van de drie.

Toepassingen

Volgens OpenAI zijn de GPT-4.1-modellen geoptimaliseerd op basis van feedback van ontwikkelaars. In de praktijk blijken ze betere resultaten te leveren bij taken zoals codegeneratie, verwerking van lange documenten en het bouwen van agenten die zelfstandig acties ondernemen.

lees ook

OpenAI wil grootste AI-model GPT-4.5 uit API halen

Bedrijven zoals Windsurf, Qodo, Blue J, Hex en Thomson Reuters testten GPT-4.1 in productie. Ze rapporteren verbeteringen op vlak van efficiëntie, nauwkeurigheid en bruikbaarheid bij complexe taken, zoals juridische analyse of codebeoordeling.

GPT-4.1 is uitsluitend beschikbaar via de API. In ChatGPT blijven verbeteringen van GPT-4.1 geleidelijk geïntegreerd in de GPT-4o-versie.