OpenAI en Broadcom bouwen eerste custom AI-chip

De custom AI-chip Jalapeño van OpenAI en Broadcom (AVGO) markeert OpenAI's eerste stap in propriëtaire silicium, speciaal ontworpen voor inference-workloads in zowel zijn eigen modellen als AI-systemen van derden. Gebouwd in slechts negen maanden, zou de chip huidige geavanceerde processors in vroege testen overtreffen, een directe uitdaging aan Nvidia (NVDA).

In het kort

Chip naam: Jalapeño, ontworpen door OpenAI, geproduceerd in samenwerking met Broadcom
Ontwikkelingstijdlijn: negen maanden van ontwerp tot voltooiing
Primair toepassingsgebied: AI inference, compatibel met OpenAI-modellen en systemen van derden
Uitrol: begint later in 2025 en loopt door in volgende jaren als meerlagig platform
Marktreactie: Broadcom-aandelen stegen meer dan 1% na de aankondiging

Wat Jalapeño is en waarom OpenAI het bouwde

Inference is het operationele hart van elk ingezet AI-systeem. Het is het rekenproces dat een getraind model draait om outputs te genereren, of dat nu betekent dat een vraag wordt beantwoord, een afbeelding wordt geclassificeerd of code wordt gegenereerd. In tegenstelling tot training, wat een eenmalige kapitaalinvestering is, is inference continu en schaalt rechtstreeks mee met gebruikersvraag. Een chip bouwen die precies op die werkbelasting is geoptimaliseerd, in plaats van te vertrouwen op processors voor algemeen gebruik, is hoe je kosten en latentie op schaal comprimeren.

OpenAI-president Greg Brockman omschreef de chip als onderdeel van een doelbewuste full-stack infrastructuurstrategie. Het doel is, in zijn woorden, om compute ruimer beschikbaar te maken zodat AI sneller, betrouwbaarder en betaalbaarder wordt voor zowel individuen als bedrijven. Meer van de onderliggende stack controleren betekent ook dat OpenAI zijn systemen precies kan afstemmen op zijn eigen modelarchitecturen in plaats van rond de beperkingen van hardware die het niet ontwerpt te werken.

Het Nvidia-probleem dat OpenAI probeert op te lossen

OpenAI is een van de grootste enkele kopers van krachtige processors van Nvidia. Die relatie verdwijnt niet van de ene op de andere dag, maar creëert wel een structurele kwetsbaarheid. Nvidia's chips zijn in buitengewone vraag in de hele AI-industrie, wat betekent dat OpenAI met elk ander AI-bedrijf, hyperscaler en onderneming die grote modellen inzet om voorraad veilig te stellen concurreert. Leveringstijdlijnen en allocatiebeperkingen zijn werkelijke operationele risico's op deze schaal.

Het ontwikkelen van propriëtair silicium via Broadcom geeft OpenAI een parallel voorzieningskanaal. Zelfs als Jalapeño Nvidia-hardware niet overal vervangt, vermindert het de afhankelijkheid en geeft het OpenAI onderhandelingskracht die het momenteel niet heeft. Het negen-maanden ontwikkelingstraject is hier opvallend: het geeft aan dat OpenAI interne chipontwerpcapaciteit snel genoeg heeft opgebouwd om zinvol te itereren, in plaats van dit als een eenmalig prototype te behandelen.

De rol van Broadcom is ook significant. Het bedrijf is de go-to partner geworden voor hyperscalers die application-specific integrated circuits ontwerpen, met Google's Tensor Processing Units onder de meest prominente voorbeelden. Het feit dat Broadcom's aandelen meer dan 1% stegen na de aankondiging weerspiegelt dat de markt leest dat deze relatie zal verdiepen en zinvolle inkomsten zal genereren.

Hoe de concurrentie zich uitstekend

OpenAI pioniert niet zozeer met custom silicium als wel aansluit bij een patroon dat al goed is ingeburgerd onder de grootste technologiebedrijven. Amazon, Google en Microsoft hebben elk custom AI-processors in productie of in actieve ontwikkeling. De Trainium en Inferentia chips van Amazon worden al aan klanten van derden via AWS verhuurd. Google's TPU's, beschikbaar via Google Cloud, voeren al jaren inference op schaal uit. Meta ontwerpt en implementeert zijn eigen chips voor AI en andere workloads intern en heeft het idee geuit van cloudcomputingservices aan te bieden, wat het in directe concurrentie met Nvidia zou plaatsen.

Aan de concurrentiekant van chips drijft AMD hard in AI datacenterhardware. Qualcomm en Cerebras vervolgend elk verschillende invalshoeken op de inference-markt. Geen van deze uitdagers heeft Nvidia's dominantie verdrongen, maar gezamenlijk vernauwen ze de voordeel. Jalapeño voegt nog een geloofwaardig alternatief aan die lijst toe, en het feit dat OpenAI beweert dat het huidige geavanceerde chips in vroege testen verslaat zal Nvidia onder druk zetten om zijn eigen roadmap onthullingen te versnellen.

Bedrijf	Custom AI-chip	Primair gebruik	Toegang voor derden
OpenAI / Broadcom	Jalapeño	Inference (OpenAI en industrie modellen)	Niet aangekondigd
Google	TPU (Tensor Processing Unit)	Training en inference	Ja, via Google Cloud
Amazon	Trainium / Inferentia	Training en inference	Ja, via AWS
Microsoft	Azure Maia	Training en inference	Intern / Azure
Meta	MTIA	Inference en ranking-workloads	Nee (intern)
AMD	Instinct MI serie	Training en inference	Ja, via cloudpartners

Voor wie deze chip eigenlijk is

De positionering is breder dan OpenAI's eigen product stack. De verklaring van Brockman vermeldt expliciet compatibiliteit met AI-modellen in de hele industrie, niet alleen die van OpenAI. Deze formulering suggereert dat OpenAI op termijn Jalapeño-gebaseerde compute aan externe klanten kan aanbieden, vergelijkbaar met het model dat Amazon en Google hebben aangenomen. Als dat gebeurt, verschuiven OpenAI's ambities van AI-lab naar infrastructuurprovider, een aanzienlijke uitbreiding van het zakelijke oppervlak ervan.

Voor nu is de directe begunstigde OpenAI's eigen inference-stack. ChatGPT en de API op schaal uitvoeren is duur, en elke efficiëntiewinst op chip-niveau stroomt rechtstreeks in de brutomarge. Gezien de kostendrukkingen die samenhangen met het bedienen van honderden miljoenen gebruikers, samengeste zelfs bescheiden per-query-besparingen in substantiële getallen op OpenAI's volume.

Broadcom profiteert van een geprofileerde designwin die zijn positie als voorkeur chippartner voor bedrijven die custom silicium willen zonder hun eigen fabricagecapaciteiten te bouwen valideert. Nvidia staat voor een langer termijnsignaal dat zijn belangrijkste klanten actief in alternatieven investeren, zelfs als die alternatieven vandaag eerder complementair dan puur vervangend zijn.

Veelgestelde vragen

Wat doet Jalapeño anders dan Nvidia's chips?

Jalapeño is speciaal gebouwd voor inference, het proces van het draaien van getrainde AI-modellen om outputs te produceren, in plaats van voor het bredere scala aan rekentaken dat Nvidia's GPU's hanteren. OpenAI stelt dat het huidige geavanceerde chips in vroege testen overtreft, hoewel onafhankelijke benchmarks nog niet zijn gepubliceerd.

Zal Jalapeño Nvidia-hardware bij OpenAI vervangen?

OpenAI heeft niet aangegeven dat het van plan is Nvidia-processors geleidelijk uit te faseren. De chip wordt beschreven als onderdeel van een meerlagige platformstrategie, wat suggereert dat hij naast bestaande Nvidia-hardware zal draaien in plaats van het op korte termijn volledig te vervangen.

Zou OpenAI Jalapeño-gebaseerde compute aan andere bedrijven kunnen aanbieden?

OpenAI heeft geen formele aankondiging gedaan van externe cloudtoegang tot de chip, maar het genoemde doel om deze voor gebruik met AI-modellen in de hele industrie te ontwerpen laat die deur open. Amazon en Google zijn al in precies die richting gegaan met hun eigen custom chips.

Wat is de rol van Broadcom in de chip?

Broadcom is de manufacturing en design partner. OpenAI ontwierp de chip, en Broadcom leverde de engineering en productie-infrastructuur om het naar silicium te brengen. Broadcom heeft een soortgelijke rol gespeeld voor Google's TPU's en andere custom chips van hyperscalers.

Waar de race voor custom silicium heen gaat

Jalapeño wordt beschreven als de eerste chip in een meerlagig computingplatform, met bredere uitrol vanaf later in 2025. Die roadmap-taal doet ertoe: het betekent dat OpenAI zich eraan verbindt deze hardware in de loop der tijd te blijven verbeteren, niet om het als een eenmalig experiment te behandelen. Voor Nvidia is het meer bezorgwekkende gegeven niet een enkele chip maar het samenstellende effect van elk groot AI-bedrijf dat zijn eigen silicium bouwt. Voorzieningsdiversificatie in de hele industrie beperkt Nvidia's prijsstelling op lange termijn structureel, zelfs als geen enkel alternatief zijn huidige prestatiecapaciteit evenaard.