OpenAI et Broadcom lancent leur puce IA personnalisée

La puce IA personnalisée OpenAI et Broadcom (AVGO) appelée Jalapeño marque la première incursion d'OpenAI dans le silicium propriétaire, conçue spécifiquement pour les charges de travail d'inférence sur ses propres modèles et les systèmes d'IA tiers. Développée en seulement neuf mois, la puce surpasserait les processeurs de pointe actuels lors des tests préliminaires, un défi direct à Nvidia (NVDA).

Aperçu

Nom de la puce : Jalapeño, conçue par OpenAI, fabriquée en partenariat avec Broadcom
Calendrier de développement : neuf mois de la conception à la réalisation
Principal cas d'usage : inférence IA, compatible avec les modèles OpenAI et les systèmes tiers
Déploiement : commence plus tard en 2025 et s'étend aux années suivantes sous forme de plateforme multi-générations
Réaction du marché : les actions de Broadcom ont augmenté de plus de 1% à l'annonce

Ce qu'est Jalapeño et pourquoi OpenAI l'a construit

L'inférence est le cœur opérationnel de tout système d'IA déployé. Il s'agit du processus de calcul qui exécute un modèle entraîné pour générer des résultats, qu'il s'agisse de répondre à une invite, de classer une image ou de générer du code. Contrairement à l'entraînement, qui est une dépense en capital unique, l'inférence est continue et évolue directement avec la demande des utilisateurs. Construire une puce optimisée pour exactement cette charge de travail, plutôt que de compter sur des processeurs à usage général, est la façon de compresser le coût et la latence à grande échelle.

Le président d'OpenAI, Greg Brockman, a présenté la puce comme faisant partie d'une stratégie d'infrastructure complète délibérée. L'objectif, selon ses propres termes, est de rendre le calcul plus abondant afin que l'IA devienne plus rapide, plus fiable et plus abordable pour les particuliers et les entreprises. Contrôler davantage de la pile sous-jacente signifie également qu'OpenAI peut affiner précisément ses systèmes en fonction de ses propres architectures de modèles plutôt que de contourner les contraintes du matériel qu'il ne conçoit pas.

Gros plan sur circuit imprimé de puce IA

Le problème Nvidia qu'OpenAI essaie de résoudre

OpenAI est l'un des plus grands acheteurs uniques de processeurs haute performance de Nvidia. Cette relation ne disparaîtra pas du jour au lendemain, mais elle crée une vulnérabilité structurelle. Les puces de Nvidia sont en demande extraordinaire dans l'ensemble de l'industrie de l'IA, ce qui signifie qu'OpenAI entre en concurrence avec toutes les autres entreprises d'IA, hyperscalaires et entreprises déployant de grands modèles juste pour sécuriser l'approvisionnement. Les délais de livraison et les contraintes d'allocation sont des risques opérationnels réels à cette échelle.

Le développement de silicium propriétaire via Broadcom donne à OpenAI un canal d'approvisionnement parallèle. Même si Jalapeño ne remplace pas le matériel Nvidia de manière générale, cela réduit la dépendance et donne à OpenAI un levier de négociation qu'elle n'a actuellement pas. La fenêtre de développement de neuf mois est notable ici : elle signale qu'OpenAI a construit une capacité de conception de puces interne assez rapidement pour itérer de manière significative, plutôt que de traiter cela comme un prototype unique.

Le rôle de Broadcom est également important. L'entreprise est devenue le partenaire incontournable des hyperscalaires qui conçoivent des circuits intégrés spécifiques à une application, les unités de traitement tenseur de Google figurant parmi les exemples les plus connus. L'augmentation des actions de Broadcom de plus de 1% à l'annonce reflète la lecture du marché selon laquelle cette relation s'approfondira et générera des revenus significatifs.

Comment la compétition se profile

OpenAI ne pionnière pas le silicium personnalisé autant qu'elle rattrape un modèle déjà bien établi parmi les plus grandes entreprises technologiques. Amazon, Google et Microsoft ont chacun des processeurs IA personnalisés soit en production, soit en développement actif. Les puces Trainium et Inferentia d'Amazon sont déjà louées à des clients tiers via AWS. Les TPU de Google, disponibles via Google Cloud, exécutent l'inférence à grande échelle depuis des années. Meta conçoit et déploie ses propres puces pour l'IA et d'autres charges de travail en interne et a évoqué l'idée d'offrir des services d'informatique en nuage, ce qui la mettrait en concurrence directe avec Nvidia.

Du côté de la compétition en matière de puces, AMD pousse fort dans le matériel des centres de données d'IA. Qualcomm et Cerebras poursuivent chacun différentes approches du marché de l'inférence. Aucun de ces challengers n'a déplacé la domination de Nvidia, mais collectivement, ils réduisent l'avantage compétitif. Jalapeño ajoute une alternative crédible de plus à cette liste, et le fait qu'OpenAI affirme qu'elle surpasse les puces de pointe actuelles lors des tests préliminaires exercera une pression sur Nvidia pour accélérer ses propres divulgations de feuille de route.

Entreprise	Puce IA personnalisée	Usage principal	Accès tiers
OpenAI / Broadcom	Jalapeño	Inférence (modèles OpenAI et industriels)	Non annoncé
Google	TPU (Tensor Processing Unit)	Entraînement et inférence	Oui, via Google Cloud
Amazon	Trainium / Inferentia	Entraînement et inférence	Oui, via AWS
Microsoft	Azure Maia	Entraînement et inférence	Interne / Azure
Meta	MTIA	Inférence et charges de travail de classement	Non (interne)
AMD	Instinct MI series	Entraînement et inférence	Oui, via partenaires cloud

Pour qui cette puce est vraiment destinée

Le positionnement est plus large que la seule pile de produits d'OpenAI. La déclaration de Brockman mentionne explicitement la compatibilité avec les modèles d'IA de l'industrie, pas seulement celle d'OpenAI. Cette formulation suggère qu'OpenAI pourrait éventuellement proposer un calcul basé sur Jalapeño à des clients externes, similaire au modèle qu'Amazon et Google ont adopté. Si cela se produit, les ambitions d'OpenAI passent du laboratoire d'IA au fournisseur d'infrastructure, une expansion significative de sa surface commerciale.

Pour l'instant, le bénéficiaire immédiat est la pile d'inférence d'OpenAI elle-même. Exécuter ChatGPT et l'API à grande échelle est coûteux, et tout gain d'efficacité au niveau de la puce s'écoule directement dans la marge brute. Compte tenu des pressions de coût qui accompagnent le service de centaines de millions d'utilisateurs, même des économies modestes par requête se composent en chiffres matériels au volume d'OpenAI.

Broadcom bénéficie d'une victoire de conception de haut profil qui valide sa position de partenaire de puce préféré pour les entreprises qui souhaitent du silicium personnalisé sans construire leurs propres capacités de fabrication. Nvidia fait face à un signal à plus long terme que ses clients les plus importants investissent activement dans des alternatives, même si ces alternatives sont complémentaires plutôt que purement substitutionnelles aujourd'hui.

Questions fréquemment posées

Qu'est-ce que Jalapeño fait différemment des puces de Nvidia ?

Jalapeño est construite spécifiquement pour l'inférence, le processus d'exécution de modèles d'IA entraînés pour produire des résultats, plutôt que pour la gamme plus large de tâches de calcul que les GPU de Nvidia gèrent. OpenAI affirme qu'elle surpasse les puces de pointe actuelles lors des tests préliminaires, bien que des critères de référence indépendants n'aient pas encore été publiés.

Jalapeño remplacera-t-elle le matériel Nvidia chez OpenAI ?

OpenAI n'a pas indiqué qu'elle prévoyait d'éliminer progressivement les processeurs Nvidia. La puce est décrite comme faisant partie d'une stratégie de plateforme multi-générations, suggérant qu'elle fonctionnera aux côtés du matériel Nvidia existant plutôt que de le remplacer complètement à court terme.

OpenAI pourrait-elle proposer un calcul basé sur Jalapeño à d'autres entreprises ?

OpenAI n'a pas officiellement annoncé l'accès cloud externe à la puce, mais l'objectif déclaré de la concevoir pour une utilisation avec des modèles d'IA dans l'industrie laisse cette porte ouverte. Amazon et Google ont déjà avancé exactement dans cette direction avec leurs propres puces personnalisées.

Quel est le rôle de Broadcom dans la puce ?

Broadcom est le partenaire de fabrication et de conception. OpenAI a conçu la puce, et Broadcom a fourni l'infrastructure d'ingénierie et de production pour la concrétiser en silicium. Broadcom a joué un rôle similaire pour les TPU de Google et d'autres puces personnalisées d'hyperscalaires.

Où la course au silicium personnalisé va ensuite

Jalapeño est décrite comme la première puce d'une plateforme informatique multi-générations, avec un déploiement plus large commençant plus tard en 2025. Ce langage de feuille de route est important : cela signifie qu'OpenAI s'engage à itérer sur ce matériel au fil du temps, pas à le traiter comme une expérience unique. Pour Nvidia, le point de données plus préoccupant n'est pas une seule puce mais l'effet cumulatif de chaque grande entreprise d'IA construisant son propre silicium. La diversification de l'approvisionnement dans l'industrie limite structurellement le pouvoir de fixation des prix de Nvidia au fil du temps, même si aucune alternative unique n'égale son plafond de performance actuel.