Силициевата обвивка на AI
Темата за изкуствения интелект (AI) все повече се разгорещява, възможностите му се разширяват с всеки изминал месец, включително вече сме свидетели и на първия български модел. Докато всички са фокусирани върху алгоритмите и техните приложения, някои започнаха да мислят и за хардуера. AI натовари доста настоящата сървърна инфраструктура и това ще се задълбочава като проблем през следващите години.
Идеята да се превърне всяко устройство в интелигентно и задвижвано от изкуствен интелект, отново излезе на преден план. За което са необходими процесори и специализирани чипове. Много от тях. Част от модерните смартфони вече имат подобни ядра с невронна мрежа. Но сървъри, лаптопи, настолни компютри – всичко това не е толкова готово да посрещне нуждите за AI революцията.
Графичните процесори и ускорители се оказват първоначален спасителен пояс. Комбинацията с традиции в този сектор и силна развойна дейност в сферата на AI трансформират Nvidia в истински технологичен гигант за два трилиона долара. Което е нож с две остриета, защото в един момент, същата компания може да се окаже монополист на голяма част от AI чиповете по света.
Нещо, заради което основателят и главен изпълнителен директор на OpenAI се опасява и търси трилиони долари за изграждането на нови производствени мощности. Това в комбинацията, че всички тазгодишни флагмански смартфони върнаха на мода AI функционалностите, а Qualcomm добавя разширени такива за своите мобилни процесори.
Ускорителят CUDA на ракетата Nvidia
В месеците преди пандемията малко хора са предполагали, че производителят на графични карти Nvidia ще се превърне в истински технологичен мастодонт. Все пак компанията дотогава е сравнително нишов играч. Акциите ѝ до края на 2019 г. са достигали максимална стойност от 70 долара за брой. В рамките на пет години те се изстрелват до над 900 долара или с 1290%. Nvidia е една от малкото корпорации, които надминаха пазарна капитализация от 2 трлн. долара, като в момента са на ниво от 2.26 трлн.
Причината е в повишеният интерес и развитие на изкуствения интелект (AI). Графичните процесори са подходящи за извършването на много паралелни изчисления, за разлика от традиционните. Което ги прави идеални, както до скоро за копаене на криптовалута, така и за AI операции. Допълнителен фактор е и програмният интерфейс CUDA, отново дело на Nvidia. Той позволява виртуализация на процесите и улеснява значително паралелните изчисления, спрямо другите интерфейси.
От 2015 г. Nvidia започва да развива CUDA в посока на AI изчисления, действие, което се отплаща значително десетилетие по-късно. В рамките на само две години, компанията също така вече не предлага само графични карти, но и специални системи за обработка на AI данни. Първоначално те наподобяват по-скоро решения сходни по обем и възможности на суперкомпютрите, но с времето нещата еволюират.
Комбинацията между акумулираното ноу-хау в графичните процесори и CUDA интерфейса позволяват на американския гигант да изгради голяма AI общност, която работи само с техните системи. Така се стига до момент, в който почти всяко голямо решение, базирано на изкуствен интелект се разработва посредством технологиите на Nvidia.
AI чиповете
В годините след 2017 г., Nvidia започва да създава специализирани чипове, които са фокусирани върху изчисления за изкуствен интелект. Първоначално те идват под формата на нещо като супер видеокарта за центрове за данни – моделът A100 е добър пример за това. През септември 2023 г. компанията пуска и първото си по-пълно решение – H100. То е базирана и на нова процесорна архитектура – Hopper. С което, Nvidia се опитва да затвори напълно целия цикъл свързан с хардуерния AI.
H100 може да се каже, че променя напълно правилата на играта. Nvidia не само започва да продава подобни решения на лидери в AI, като Google например. Но и да заделя хиляди от тях за изграждането на собствени облачни AI центрове. Техният капацитет ще се отдава под наем на всяка компания, която поиска и има пари да плати.
Ефективността на AI чиповете е ключов компонент. Ако можеш да постигнеш същата производителност и възможност за обучение на изкуствен интелект с по-малко процесори, то разликата в цената им се избива сравнително бързо. Предвид скоростното развитие на генеративния AI и огромния бизнес, който може да отвори, търсенето за капацитет ще расте със сходни темпове. Прогнозите на Bloomberg са, че до 2032 г. този пазар ще достигне 1.3 трлн. долара, докато през 2022 г. е само 40 млрд. долара.
Трилионните амбиции на OpenAI
Nvidia е може би най-силният играч при AI чиповете, но не е единствен. Google развива собствени процесори и сървъри, AMD също се опитва да върви по стъпките на своя конкурент в графичните карти, Apple, Samsung, Qualcomm и др. развиват решения в мобилния сегмент. Всеки един от тях се стреми да изгради процесорни възможности за обработка на AI изчисления.
Съоснователят на OpenAI Сам Алтман вижда проблема с процесорния капацитет. Затова той е започнал да търси крупни инвеститори, с които да изгради производство за AI чипове. С тях трябва да захранят сървърите на ChatGPT, Dall-E, Sora и другите езикови модели. Става дума обаче за наистина космически суми, като според някои източници достигат 7 трлн. долара. Според Алтман, всички графични карти няма да стигнат, за да се посрещнат нуждите за генеративния AI в близко бъдеще.
Експертите обаче смятат идеята му не само за екстравагантна, но и безумна. Сумата от 7 трлн. долара е огромна, с нея Алтман ще може да изгради центрове за данни с 40 пъти по-голям изчислителен капацитет от всички в САЩ плюс да изгради 100 завода за полупроводници и накрая ще му останат няколко трилиона ресто.
Много е вероятно, Алтман да преувеличава значително, за да може да събере пак голямо финансиране, но в доста по-реалистични рамки. Целта е OpenAI да изгради и хардуерен бизнес и така да затвори напълно цикъла на пазара на изкуствен интелект.
Неслучайно, Nvidia обяви, че видеокартите ѝ от най-високия клас ще могат да се използват, за работа с приложения с генеративен AI. Без да се налага да се минава през облачните сървъри. По този начин, в близко бъдеще пазарът може да се окаже достатъчно наситен с потребителски процесори, които да правят AI изчисления. Qualcomm също пусна мобилен чипсет с подобни възможности – Snapdragon 8 Gen 3, а тези на Apple имат също стабилно количество невронни ядра.
Отворен срещу затворен модел
Ситуацията с AI хардуера наподобява тази с езиковите модели на генеративния изкуствен интелект. Сблъскват се идеите за отворен срещу затворен подход. Създаден да брани първия, OpenAI постепенно се превърна в компания, която преследва втория при разработката на своите модели. В хардуерната част проблемът е идентичен – какъв тип софтуер го управлява най-ефективно.
Центърът на вниманието остава CUDA – архитектурата за момента е голямата разлика между това, което предлага Nvidia и конкурентите. Тя обаче е изцяло затворен модел, който се държи здраво от технологичния гигант. Затова, повечето водещи компании в тази сфера се обединяват с идеята да създадат аналог на CUDA, наречен OneAPI, който да разчита на отворен код. Така се появява фондацията UXL, като първите нейни резултати се очакват през втората половина на 2024 г. В нея влизат AMD, Intel, Google, ARM, Qualcomm, Samsung и др.
Бъдещето на силициевия AI е горе-долу ясно – до няколко години повечето масови устройства ще разполагат с изчислителни възможности да движат някои езикови модели. Самият изкуствен интелект от своя страна ще се нарои на по-специализирани алгоритми, които ще са по-оптимизирани за конкретен тип работа. Само най-обемните задачи ще изискват големи центрове за данни. Поне това е концепцията и на хардуерно ниво изглежда повече от постижимо. Споровете и битките ще са на софтуерно такова в съревнование на интерфейсите.