DeepSeek - най-голямото главоболие за лидерите в Силициевата долина

05 February 2025

Евита Смилкова

Чатботът е измислен година след създаването на стартъпа.

Създателят на чатбота имал огромна колекция от мощни чипове на Nvidia, които Байдън забрани за износ към Пекин

969 млрд. долара - с толкова се срина стойността на американските технологични компании в S&P индекса веднага щом Китай пусна най-големия конкурент в сферата на изкуствения интелект.

DeepSeek светкавично се превърна в най-голямото главоболие за лидерите в Силициевата долина, предизвика паника сред инвеститорите, като едновременно с това хвърли поглед върху цензурата на Изток. Чатботът послужи и за нещо много важно: доказа на Европа, че не е твърде късно да се качи на влака на иновациите и да утвърди мястото си сред лидерите в AI индустрията. Появиха се обаче и първите съмнения, че с манипулиране на информацията евтино китайско менте на AI иска да се представи като истински продукт.

Някои се изплашиха:

Италия вече забрани технологията да се използва, Ирландия и Белгия започнаха разследвания

Основната неяснота е с каква информация се захранва чатботът и защитени ли са данните на потребителите му. Отговорът не е еднозначен. Преди да задълбаем обаче, нека се обърнем към историята на тази компания, за да разберем светкавичния ѝ успех.

DeepSeek е изключително млад технологичен стартъп със седалище Ханджоу, Китай. Създаден през май 2023 г., а главният му акционер и изпълнителен директор към момента е Лян Уенфън. Зад компанията стои огромният хеджфонд High-Flyer - първият в Китай, който набра над 100 млрд. юана (13 млрд. долара). Компанията се фокусира върху изследването и прилагането на изкуствения интелект. Това е и едно от основните ѝ предимства - първоначално е смятана за изследователска, а не за предприемаческо дружество. Към края на 2024 г. представя своя езиков модел V3, а през януари т.г. пусна подобрената версия с отворен код - R1. Представена е за толкова добра, колкото последната версия на OpenAI и Meta. Но и по китайските твърдения била много по евтина за изработване и използване от бзинеса. Стартъпът казва, че финалната версия на чатбота е струвала под $ 6 млн. Което не е вярно, още повече сравнено със стотиците милиони и дори милиарди долари, използвани от американски компании за разработка на изкуствен интелект. За сравнение разработката от OpenAI на модела GPT-4 се оценява на между $100 милиона и $1 милиард.

В действителност 6-те милиона долара са дадени от китайците само за обучение на финалната версия на модела, т.нар. compute, при което са използвани 2048 чипа от вида H800 на американската компания Nvidia. В тази сума не са включени общите разходи за разработката. Експертите предполагат, че важни процеси като изследвания, разработки и изграждане на инфраструктура, както и добиване на достоверна информация вероятно

далеч надхвърлят 6-те милиона долара, цитирани за финалното обучение

Друг важен детайл, който остава неразяснен, е колко обучения са нужни, за да се достигне до модел, равностоен на най-развитите американски конкуренти. Според Мартин Вечев, професор в ETH Zurich и научен директор на българския институт за изкуствен интелект INSAIT, цитираните близо 6 млн. долара са цената само на едно обучение. По негови думи развитието на модел с такива мащаби налага провеждането на множество обучения, което означава и много по-голям финансов ресурс.

На този фон се появиха и много съмнения относно разработката на DeepSeek - какви чипове са използвани, върху чий модел е обучаван китайският, а също и как се съхранява информацията, предоставена от потребителите на компанията. OpenAI вече обвини китайския си конкурент, че е използвал нейни модели, за да обучи своя. Условията на американския лидер изрично забраняват използването на негови резултати за разработване на конкурентни AI системи, което поражда опасения за нарушения на интелектуалната собственост.

Появиха се също интересни слухове относно историята на Лян Уенфън, преди да се захване с хеджфонда и разработването на AI. Смята се, че до 2021 г. младият предприемач се е снабдил с колекция от 10 хил. графични процесора (GPU) на Nvidia за лична употреба. Само няколко големи китайски технологични фирми имат подобни запаси от полупроводници на Nvidia. “Много хора биха си помислили, че зад това стои неизвестна бизнес логика, но всъщност тя се ръководи главно от любопитство”, казва самият той през 2023 г. Любопитството му обаче е дошло тъкмо навреме - през 2022 г. Джо Байдън забрани изнасянето на полупроводници, предназначени за Китай. С това той целеше

да спре достъпа на страната до мощно оборудване, необходимо за бързото развитие на AI

Мощният чип H100 на Nvidia беше забранен, а компанията разработи по-малко мощните чипове H800 за китайския пазар. DeepSeek твърди, че именно с тях е обучила своя модел. Редица експерти смятат обаче, че в инфраструктурата са заложени 50 хил. чипа Н100. Цената на един чип е 25 хил. долара, което означава, че само за инфраструктурата са инвестирани 1,250 млрд. долара. Ако пък е ползван по-евтиният чип, цената ще е около 1,1 млрд. долара. Доста далеч от обявените 6 млн. долара.

Докато световният бизнес се бори за технологично могъщество, DeepSeek послужи също в социален аспект като прозорец към иначе затворения свят на Изток. На китайския народ са забранени редица западни социални мрежи и приложения като фейсбук, инстаграм и ютюб. Това до голяма степен отделя източната от западната култура, което прави достъпа до информация труден. DeepSeek обаче се оказа отворен прозорец към цензурата в Китай. Запитан какво мисли за комунизма, Си Цзинпин и управляващата Китайска комунистическа партия, чатботът отговаря: Съжалявам, това е извън настоящия ми обхват. Нека поговорим за нещо друго. Същият е отговорът на въпроса “Какво се е случило на площад Тянанмън през 1989 г.?”. За сравнение последният модел на ChatGPT 4-о отговаря: Моята гледна точка... се основава на исторически и съвременен анализ, а не на лично мнение. След което с 2-3 изречения описва всяко понятие. А за Тянанмън през 1989 г. разказва в 3 параграфа. Протестите и клането на площад Тянанмън от 1989 г. бяха продемократично движение, водено предимно от студенти в Пекин, Китай, разказва ChatGPT в ярък контраст със своя конкурент.

Важно различие в методите на Изток и на Запад се усеща дори в имената, дадени на чатботовете. DeepSeek, преведено от английски, означава “задълбочено търсене”. А слоганът, изписан точно под името, е Into the unknown - “в непознатото”. Името създава усещане за тайнственост, но е свързано също с любопитство към изследването на непознати досега теории и разширяване на познатото дотук. На Запад повечето модели предпочитат по-приятелски послания. Gemini (от англ. - близнаци) на “Гугъл” например е вдъхновено от астрологията и означава, че чатботът играе ролята на близнака на човека. Името Copilot на “Майкрософт” пък е вдъхновено от идеята, че човекът е главният пилот, а неговият помощник е чатботът.

На кого ще се довери всеки един потребител, остава въпрос на личен избор. Макар множеството въпросителни около китайския конкурент DeepSeek вече се използва от между 5 и 6 милиона потребители, а приложението му е свалено 2,1 млн. пъти, правейки го номер 1 в редица държави по света. Тепърва предстои да се отговори на важни въпроси относно съхраняването и използването на лични данни.

Ключови думи

DeepSeek

джаджи