OpenAI und Broadcom bauen ersten Custom-AI-Chip

Der Custom-AI-Chip Jalapeño von OpenAI und Broadcom (AVGO) markiert OpenAIs erste Ausflug in proprietäre Silizium, speziell für Inferenz-Workloads für sowohl die eigenen Modelle als auch KI-Systeme von Drittanbietern konzipiert. Der in nur neun Monaten entwickelte Chip soll in frühen Tests aktuelle hochmoderne Prozessoren übertreffen und stellt eine direkte Herausforderung für Nvidia (NVDA) dar.

Auf einen Blick

Chip-Name: Jalapeño, von OpenAI konzipiert, in Partnerschaft mit Broadcom hergestellt
Entwicklungszeitraum: neun Monate von der Konzeption bis zur Fertigstellung
Primärer Verwendungszweck: KI-Inferenz, kompatibel mit OpenAI-Modellen und Systemen von Drittanbietern
Markteinführung: beginnt später in 2025 und erstreckt sich in die folgenden Jahre als Multi-Generationen-Plattform
Marktreaktion: Broadcom-Aktien stiegen bei der Ankündigung um mehr als 1 Prozent

Was Jalapeño ist und warum OpenAI ihn gebaut hat

Inferenz ist das operative Herzstück jedes eingesetzten KI-Systems. Es ist der Rechenprozess, der ein trainiertes Modell ausführt, um Outputs zu generieren, ob das bedeutet, eine Frage zu beantworten, ein Bild zu klassifizieren oder Code zu generieren. Anders als Training, das eine einmalige Kapitalausgabe ist, ist Inferenz kontinuierlich und skaliert direkt mit der Benutzernachfrage. Der Bau eines Chips, der speziell für diesen Workload optimiert ist, anstatt sich auf Universal-Prozessoren zu verlassen, ist der Weg, wie man Kosten und Latenz im großen Maßstab reduziert.

OpenAI-Präsident Greg Brockman beschrieb den Chip als Teil einer bewussten Full-Stack-Infrastrukturstrategie. Das Ziel, in seinen Worten, ist es, Rechenleistung reichlicher zu machen, damit KI schneller, zuverlässiger und erschwinglicher wird, sowohl für Einzelpersonen als auch für Unternehmen. Die Kontrolle über mehr des zugrunde liegenden Stacks bedeutet auch, dass OpenAI seine Systeme präzise an die eigenen Modellarchitekturen abstimmen kann, anstatt um die Einschränkungen von Hardware zu arbeiten, die es nicht entwirft.

Das Nvidia-Problem, das OpenAI lösen will

OpenAI ist einer der größten Einzelkäufer von Nvidias leistungsstarken Prozessoren. Diese Beziehung wird nicht über Nacht verschwinden, aber sie schafft eine strukturelle Anfälligkeit. Nvidias Chips sind in außerordentlicher Nachfrage in der gesamten KI-Industrie, was bedeutet, dass OpenAI mit jedem anderen KI-Unternehmen, Hyperscaler und jeder Enterprise konkurriert, die große Modelle bereitstellen, nur um Lieferkettenengpässe zu sichern. Lieferzeitpläne und Allokationsbeschränkungen sind echte operative Risiken in diesem Maßstab.

Die Entwicklung proprietärer Silizium über Broadcom gibt OpenAI einen parallelen Lieferkanal. Selbst wenn Jalapeño Nvidia-Hardware nicht flächendeckend ersetzt, reduziert es die Abhängigkeit und gibt OpenAI Verhandlungsstärke, die es derzeit nicht hat. Das neun-monatige Entwicklungsfenster ist bemerkenswert: es signalisiert, dass OpenAI interne Chip-Design-Fähigkeiten schnell genug aufgebaut hat, um aussagekräftig zu iterieren, anstatt dies als einmaliges Prototyp zu behandeln.

Broadcoms Rolle ist ebenfalls bedeutsam. Das Unternehmen ist zum bevorzugten Partner für Hyperscaler geworden, die anwendungsspezifische integrierte Schaltkreise entwerfen, wobei Googles Tensor Processing Units zu den prominentesten Beispielen gehören. Broadcoms Aktie stieg bei der Ankündigung um mehr als 1 Prozent, was widerspiegelt, dass der Markt reads, dass diese Beziehung vertieft wird und aussagekräftige Einnahmen generiert.

Wie sich der Wettbewerb abspielt

OpenAI ist nicht Pionier bei Custom Silizium, sondern holt in einem Muster auf, das bereits unter den größten Technologiekonzernen fest etabliert ist. Amazon, Google und Microsoft haben alle Custom-AI-Prozessoren entweder in Produktion oder in aktiver Entwicklung. Amazons Trainium und Inferentia Chips werden bereits an Drittkundschaft über AWS vermietet. Googles TPUs, verfügbar über Google Cloud, führen seit Jahren Inferenz im großen Maßstab durch. Meta entwirft und stellt seine eigenen Chips für KI und andere Workloads intern bereit und hat die Idee geäußert, Cloud-Computing-Dienste anzubieten, was es in direkten Wettbewerb mit Nvidia stellen würde.

Auf der Wettbewerbs-Chip-Seite treiben AMD und andere hart in KI-Datencenter-Hardware voran. Qualcomm und Cerebras verfolgen jeweils unterschiedliche Winkel auf dem Inferenz-Markt. Keiner dieser Herausforderer hat Nvidias Dominanz verdrängt, aber insgesamt verengen sie den Burggraben. Jalapeño fügt dieser Liste ein weiteres glaubwürdiges Gegenprogramm hinzu, und die Tatsache, dass OpenAI behauptet, es schlägt aktuelle hochmoderne Chips in frühen Tests, wird Nvidia unter Druck setzen, seine eigenen Roadmap-Offenlegungen zu beschleunigen.

Unternehmen	Custom-AI-Chip	Primäre Verwendung	Zugang für Dritte
OpenAI/Broadcom	Jalapeño	Inferenz (OpenAI und Industrie-Modelle)	Nicht angekündigt
Google	TPU (Tensor Processing Unit)	Training und Inferenz	Ja, über Google Cloud
Amazon	Trainium/Inferentia	Training und Inferenz	Ja, über AWS
Microsoft	Azure Maia	Training und Inferenz	Intern/Azure
Meta	MTIA	Inferenz und Ranking-Workloads	Nein (intern)
AMD	Instinct MI Serie	Training und Inferenz	Ja, über Cloud-Partner

Für wen dieser Chip tatsächlich ist

Die Positionierung ist breiter als OpenAIs eigener Produktstack. Brockmans Aussage erwähnt explizit die Kompatibilität mit KI-Modellen in der gesamten Branche, nicht nur mit Modellen von OpenAI. Diese Formulierung deutet darauf hin, dass OpenAI möglicherweise irgendwann Jalapeño-basierte Rechenleistung an externe Kunden anbietet, ähnlich dem Modell, das Amazon und Google angenommen haben. Wenn das passiert, verschieben sich OpenAIs Ambitionen von KI-Labor zu Infrastruktur-Anbieter, eine bedeutende Ausweitung seiner Geschäftsfläche.

Vorerst ist der unmittelbare Nutznießer OpenAIs eigener Inferenz-Stack. Das Betreiben von ChatGPT und der API im großen Maßstab ist teuer, und jede Effizienzgewinnung auf Chip-Ebene fließt direkt in die Bruttomarge. Angesichts der Kostendrucke, die mit der Bedienung von Hunderten Millionen von Benutzern einhergehen, summieren sich selbst bescheidene Pro-Anfrage-Ersparnisse zu substantiellen Zahlen bei OpenAIs Volumen.

Broadcom profitiert von einem hochkarätigen Design-Erfolg, der seine Position als bevorzugter Chip-Partner für Unternehmen validiert, die Custom Silizium wollen, ohne ihre eigenen Fabrikationsfähigkeiten aufzubauen. Nvidia steht einem längerfristigen Signal gegenüber, dass seine wichtigsten Kunden aktiv in Alternativen investieren, selbst wenn diese Alternativen heute eher komplementär als rein substituierbar sind.

Häufig gestellte Fragen

Was macht Jalapeño anders als Nvidias Chips?

Jalapeño ist speziell für Inferenz konzipiert, den Prozess der Ausführung trainierter KI-Modelle, um Outputs zu produzieren, anstatt für die breitere Palette von Rechenaufgaben, die Nvidias GPUs bewältigen. OpenAI behauptet, dass es aktuelle hochmoderne Chips in frühen Tests übertrifft, obwohl unabhängige Benchmarks noch nicht veröffentlicht wurden.

Wird Jalapeño Nvidia-Hardware bei OpenAI ersetzen?

OpenAI hat nicht angekündigt, dass es plant, Nvidia-Prozessoren schrittweise auslaufen zu lassen. Der Chip wird als Teil einer Multi-Generationen-Plattformstrategie beschrieben, was darauf hindeutet, dass er auf absehbare Zeit neben bestehender Nvidia-Hardware laufen wird, anstatt sie vollständig zu ersetzen.

Könnte OpenAI Jalapeño-basierte Rechenleistung anderen Unternehmen anbieten?

OpenAI hat keinen externen Cloud-Zugang zum Chip formal angekündigt, aber das erklärte Ziel, ihn zur Verwendung mit KI-Modellen in der gesamten Branche zu entwerfen, lässt diese Möglichkeit offen. Amazon und Google haben bereits exakt in diese Richtung mit ihren eigenen Custom Chips bewegt.

Was ist Broadcoms Rolle bei dem Chip?

Broadcom ist der Fertigungs- und Design-Partner. OpenAI gestaltete den Chip, und Broadcom stellte die Ingenieur- und Produktionsinfrastruktur bereit, um ihn zum Silizium zu bringen. Broadcom hat eine ähnliche Rolle für Googles TPUs und andere Custom Chips von Hyperscalern gespielt.

Wohin geht das Custom-Silizium-Rennen von hier aus

Jalapeño wird als der erste Chip in einer Multi-Generationen-Computing-Plattform beschrieben, mit breiterer Markteinführung später in 2025. Diese Roadmap-Sprache ist wichtig: es bedeutet, dass OpenAI sich verpflichtet, diese Hardware über die Zeit hinweg zu iterieren, anstatt sie als einmaliges Experiment zu behandeln. Für Nvidia ist der besorgniserregendere Datenpunkt nicht irgendein einzelner Chip, sondern der kumulative Effekt davon, dass jedes große KI-Unternehmen sein eigenes Silizium baut. Die Angebotsvielfalt in der gesamten Industrie begrenzt strukturell Nvidias Preissetzungsmacht im Laufe der Zeit, selbst wenn keine einzelne Alternative seine aktuelle Leistungsobergrenze erreicht.