Technologia

OpenAI i Broadcom tworzą niestandardowy chip AI

OpenAI and Broadcom have unveiled Jalapeño, a custom inference chip built in nine months that OpenAI claims beats current…

Niestandardowy chip AI OpenAI i Broadcom (AVGO) o nazwie Jalapeño oznacza pierwszą inwestycję OpenAI w autorską elektronikę, zaprojektowaną specjalnie do zadań inferencji dla modeli własnych i systemów AI trzecich stron. Stworzony w zaledwie dziewięć miesięcy, chip podobno przewyższa obecne procesory najwyższej klasy w wczesnych testach, co stanowi bezpośrednie wyzwanie dla Nvidia (NVDA).

W skrócie

  • Nazwa chipa: Jalapeño, zaprojektowany przez OpenAI, produkowany we współpracy z Broadcom
  • Harmonogram rozwoju: dziewięć miesięcy od projektowania do ukończenia
  • Główny przypadek użycia: inferencja sztucznej inteligencji, kompatybilna z modelami OpenAI i systemami trzecich stron
  • Wdrożenie: rozpoczyna się w drugiej połowie 2025 roku i trwa w kolejnych latach jako platforma wielopokoleniowa
  • Reakcja rynku: akcje Broadcom wzrosły o ponad 1 procent po ogłoszeniu

Czym jest Jalapeño i dlaczego OpenAI go zbudował

Inferencja to operacyjne serce każdego wdrożonego systemu sztucznej inteligencji. To proces obliczeniowy, który uruchamia wytrenowany model w celu generowania wyników, niezależnie od tego, czy oznacza to odpowiadanie na zapytania, klasyfikację obrazów czy generowanie kodu. W przeciwieństwie do treningu, który jest jednorazowym wydatkiem kapitałowym, inferencja jest ciągła i skaluje się bezpośrednio wraz z zapotrzebowaniem użytkowników. Budowanie chipa zoptymalizowanego do dokładnie tego obciążenia pracą, zamiast polegania na procesorach ogólnego przeznaczenia, to sposób na zmniejszenie kosztów i opóźnień w skali.

Prezydent OpenAI Greg Brockman opisał chip jako część celowej strategii infrastruktury pełnego stosu. Celem, według jego słów, jest uczynić zasoby obliczeniowe bardziej dostępnymi, aby sztuczna inteligencja stała się szybsza, bardziej niezawodna i bardziej przystępna cenowo dla osób fizycznych i firm. Kontrolowanie większej części bazowego stosu oznacza również, że OpenAI może precyzyjnie dostosować swoje systemy do własnych architektur modelowych, zamiast pracować wokół ograniczeń sprzętu, który nie projektuje.

Zbliżenie na płytę obwodu chipa AI

Problem Nvidia, który OpenAI stara się rozwiązać

OpenAI jest jednym z największych pojedynczych nabywców procesorów wysokiej mocy Nvidia. Ta relacja nie zniknie w ciągu nocy, ale tworzy strukturalną słabość. Chipy Nvidia są w nadzwyczajnym zapotrzebowaniu na całej branży sztucznej inteligencji, co oznacza, że OpenAI konkuruje z każdą inną firmą zajmującą się sztuczną inteligencją, dostawcą usług w chmurze i przedsiębiorstwem wdrażającym duże modele, aby zabezpieczyć dostawy. Harmonogramy dostaw i ograniczenia alokacji stanowią rzeczywiste ryzyka operacyjne na tej skali.

Opracowanie autorskiej elektroniki przez Broadcom daje OpenAI równoległy kanał zaopatrzenia. Nawet jeśli Jalapeño nie zastąpi sprzętu Nvidia na całej planszy, zmniejsza zależność i daje OpenAI władzę negocjacyjną, której aktualnie brakuje. Dziewięciomiesięczne okno rozwoju jest tu ważne: sygnalizuje, że OpenAI zbudował wewnętrzne możliwości projektowania chipów na tyle szybko, aby iterować w znaczący sposób, zamiast traktować to jako jednorazowy prototyp.

Rola Broadcom jest również znacząca. Firma stała się preferowanym partnerem dla dostawców usług w chmurze projektujących obwody scalone charakterystyczne dla aplikacji, z jednostkami przetwarzające tensory Google wśród najbardziej znaczących przykładów. Wzrost akcji Broadcom o ponad 1 procent po ogłoszeniu odzwierciedla interpretację rynku, że ta relacja będzie się pogłębiać i generować znaczące przychody.

Jak rozkłada się konkurencja

OpenAI nie jest pionierem w niestandardowej elektronice, ale raczej dogania wzorzec już dobrze ustalony wśród największych firm technologicznych. Amazon, Google i Microsoft każdy posiadają niestandardowe procesory sztucznej inteligencji w produkcji lub w aktywnym rozwoju. Chipy Amazon Trainium i Inferentia są już wynajmowane klientom trzecim przez AWS. Jednostki TPU Google, dostępne przez Google Cloud, już od lat obsługują inferencję na dużą skalę. Meta projektuje i wdraża własne chipy do sztucznej inteligencji i innych obciążeń pracą wewnętrznie i zwróciła uwagę na możliwość oferowania usług przetwarzania w chmurze, co stawiałoby ją w bezpośredniej konkurencji z Nvidia.

Po stronie konkurencyjnych chipów AMD mocno naciska na sprzęt centrów danych sztucznej inteligencji. Qualcomm i Cerebras każdy podejmuje różne kąty ataku na rynek inferencji. Żaden z tych konkurentów nie wyparł dominacji Nvidia, ale zbiorowo zawężają to wymogu. Jalapeño dodaje jeszcze jedną wiarygodną alternatywę do tej listy, a fakt, że OpenAI twierdzi, że przewyższa obecne chipy najwyższej klasy w wczesnych testach, będzie zmuszać Nvidia do przyspieszenia ujawnień własnej mapy drogowej.

FirmaNiestandardowy chip AIGłówne zastosowanieDostęp dla trzecich stron
OpenAI / BroadcomJalapeñoInferencja (OpenAI i modele branży)Nie ogłoszono
GoogleTPU (Tensor Processing Unit)Trenowanie i inferencjaTak, przez Google Cloud
AmazonTrainium / InferentiaTrenowanie i inferencjaTak, przez AWS
MicrosoftAzure MaiaTrenowanie i inferencjaWewnętrzne / Azure
MetaMTIAInferencja i obciążenie pracą rankingoweNie (wewnętrzne)
AMDInstinct MI seriesTrenowanie i inferencjaTak, przez partnerów chmury
Wyświetlanie logo Broadcom openai

Do kogo tak naprawdę należy ten chip

Pozycjonowanie jest szersze niż własny stos produktów OpenAI. Wypowiedź Brockman'a wyraźnie wspomina o kompatybilności z modelami sztucznej inteligencji w całej branży, nie tylko w autorskich modelach OpenAI. To sformułowanie sugeruje, że OpenAI może ostatecznie zaoferować obliczenia oparte na Jalapeño klientom zewnętrznym, podobnie do modelu, który przyjęły Amazon i Google. Jeśli tak się stanie, ambicje OpenAI przesunęłyby się z laboratorium sztucznej inteligencji na dostawcę infrastruktury, znaczną ekspansję swojej powierzchni biznesowej.

Na razie bezpośrednim beneficjentem jest własny stos inferencji OpenAI. Uruchamianie ChatGPT i interfejsu API na dużą skalę jest kosztowne, a każdy wzrost wydajności na poziomie chipa bezpośrednio przepływa do marży brutto. Biorąc pod uwagę presję kosztową wynikającą z obsługiwania setek milionów użytkowników, nawet skromne oszczędności na zapytanie łączą się w istotne liczby przy wolumenie OpenAI.

Broadcom czerpie korzyści z wysoce widocznej zwycięskiej kampanii projektowej, która potwierdzą jego pozycję jako preferowanego partnera chipów dla firm, które chcą niestandardową elektronikę bez budowania własnych zdolności produkcyjnych. Nvidia stoi w obliczu sygnału długoterminowego, że jego najważniejsi klienci aktywnie inwestują w alternatywy, nawet jeśli te alternatywy są raczej komplementarne niż czysto substytucyjne dzisiaj.

Często zadawane pytania

Czym się różni Jalapeño od chipów Nvidia?

Jalapeño jest specjalnie skonstruowany do inferencji, procesu uruchamiania wytrenowanych modeli sztucznej inteligencji w celu tworzenia wyników, zamiast szerszego zakresu zadań obliczeniowych, które obsługują procesory graficzne Nvidia. OpenAI twierdzi, że przewyższa obecne chipy najwyższej klasy w wczesnych testach, choć niezależne benchmarki nie zostały jeszcze opublikowane.

Czy Jalapeño zastąpi sprzęt Nvidia w OpenAI?

OpenAI nie wskazał, że planuje wycofanie procesorów Nvidia. Chip jest opisany jako część wielopokoleniowej strategii platformy, co sugeruje, że będzie działać obok istniejącego sprzętu Nvidia, zamiast całkowicie go zastępować w bliskiej przyszłości.

Czy OpenAI mogłaby oferować obliczenia oparte na Jalapeño innym firmom?

OpenAI formalnie nie ogłosiła dostępu do chmury do chipa dla klientów zewnętrznych, ale wymieniony cel zaprojektowania go do użytku z modelami sztucznej inteligencji na całej branży pozostawia tę możliwość otwartą. Amazon i Google już podjęły dokładnie taki kierunek dzięki ich własnym niestandardowym chipom.

Jaka jest rola Broadcom w chipie?

Broadcom jest partnerem w zakresie produkcji i projektowania. OpenAI zaprojektował chip, a Broadcom zapewnił inżynierię i infrastrukturę produkcyjną, aby go zmaterializować. Broadcom pełnił podobną rolę dla jednostek przetwarzające tensory Google i innych niestandardowych chipów dostawców usług w chmurze.

Dokąd zmierza wyścig niestandardowej elektroniki

Jalapeño opisany jest jako pierwszy chip w wielopokoleniowej platformie obliczeniowej, z szerszym wdrożeniem rozpoczynającym się w drugiej połowie 2025 roku. Ta terminologia mapy drogowej ma znaczenie: oznacza, że OpenAI angażuje się w iteracyjne ulepszanie tego sprzętu w czasie, nie traktując go jako jednorazowy eksperyment. Dla Nvidia bardziej niepokojący punkt danych to nie żaden pojedynczy chip, ale złożony efekt każdej głównej firmy zajmującej się sztuczną inteligencją budującej własną elektronikę. Dywersyfikacja dostaw na całej branży strukturalnie ogranicza potęgę cenową Nvidia w czasie, nawet jeśli żadna pojedyncza alternatywa nie dorównuje jej obecnym potencjałom wydajnościowym.