Китайський додаток ШІ DeepSeek сколихнув Волл-стріт, але залишаються питання

Додаток DeepSeek на мобільному телефоні, Пекін, 27 січня 2025 року. GREG BAKER/AFP

Китайські винахідники за підтримки хедж-фонду з Ханчжоу нещодавно запустили нову модель чат-боту DeepSeek-R1, яка конкурує за можливостями з найсучаснішими продуктами штучного інтелекту, створеними у США, але, як повідомляється, робить це з меншими обчислювальними ресурсами та за значно нижчою вартістю.

High Flyer, хедж-фонд, який підтримує DeepSeek, заявив, що модель практично відповідає можливостям чатів штучного інтелекту, створених такими американськими компаніями, як OpenAI, Google і Meta. Але при цьому використовує лише близько 2000 комп’ютерних чипів старшого покоління, виготовлених американським лідером галузі – компанією Nvidia. Потужності для навчання системи коштують лише близько 6 мільйонів доларів.

Для порівняння, система штучного інтелекту Meta – Llama – використовує близько 16 000 чипів і, як повідомляється, її тренування коштує Meta значно більше.

Модель з відкритим кодом

Значний прогрес у китайських можливостях штучного інтелекту стався після багаторічних зусиль уряду США обмежити доступ Китаю до передових напівпровідників та обладнання, яке використовується для їхнього виробництва. Протягом останніх двох років, за президента Джо Байдена, США запровадили численні експортні обмеження з конкретною метою придушити прогрес Китаю в розробці ШІ.

Схоже, DeepSeek досягнув успіху завдяки новим ефективнішим алгоритмам, які дозволяють чипам у системі ефективніше спілкуватися один з одним, тим самим підвищуючи продуктивність.

Принаймні дещо з того, що розробники DeepSeek R1 зробили для покращення його продуктивності, видно спостерігачам за межами компанії, оскільки модель має відкритий код, тобто алгоритми, які вона використовує для відповідей на запити, є загальнодоступними.

Реакція ринку

Новини про можливості DeepSeek спровокували широкий розпродаж акцій технологій на американських ринках у понеділок, оскільки інвестори почали сумніватися, чи збережуть своє домінування у галузі американські компанії, які широко розрекламували власні плани інвестувати сотні мільярдів доларів у центри обробки даних ШІ та іншу інфраструктуру. На час закриття ринків в понеділок, технічний індекс Nasdaq показав падіння на 3,1%, а ціна акцій Nvidia впала майже на 17%.

Однак не всі експерти зі штучного інтелекту вважають реакцію ринку на випуск DeepSeek R1 виправданою, або що заяви про розвиток моделі слід сприймати за чисту монету.

Мел Морріс, генеральний директор британської дослідницької системи Corpora.ai, яка здійснює дослідження штучного інтелекту, сказав Голосу Америки, що хоча DeepSeek є вражаючою технологією, він вважає, що реакція ринку була надмірною, і що потрібно більше інформації, щоб точно оцінити вплив, який DeepSeek має на ринок ШІ.

“Завжди є надмірна реакція на речі, і саме це відбувається сьогодні, тому давайте просто відійдемо назад і проаналізуємо те, що ми тут бачимо, – сказав Морріс. – По-перше, ми не маємо реального розуміння скільки коштів та часу знадобилось для створення цього продукту. Ми просто не знаємо… Вони стверджують, що це значно дешевше та ефективніше, але ми не маємо доказів цього”.

Морріс сказав, що хоча продуктивність DeepSeek можна порівняти з продуктивністю продуктів OpenAI, він “ще не бачив нічого, що переконало б мене в тому, що вони справді здійснили квантовий крок у вартості експлуатації таких моделей”.

Сумніви щодо походження

Леннарт Гейм, дослідник даних із корпорації RAND, сказав Голосу Америки, що хоча очевидно, що DeepSeek R1 має переваги від інноваційних алгоритмів, які покращують його продуктивність, він погоджується, що широка громадськість насправді відносно мало знає про те, як була розроблена базова технологія.

Гейм сказав, що незрозуміло, чи вартість навчання моделі обсягом 6 мільйонів доларів, яку цитує High Flyer, насправді покриває всі витрати компанії, включаючи витрати на персонал, дані про навчання та інші фактори, чи це лише оцінка вартості остаточного “запуску” навчання з точки зору сирої обчислювальної потужності. Якщо це другий варіант, то, за словами Гейма, цифра зіставна з витратами на найкращі американські моделі.

Він також поставив під сумнів твердження про те, що DeepSeek було розроблено лише з 2000 чипів. У дописі в блозі, написаному на вихідних, він зазначив, що компанія, як вважають, вже має операції з десятками тисяч чипів Nvidia, які ймовірно можна було використовувати для роботи, необхідної для розробки моделі, здатної працювати лише на 2000 чипах.

“Цей широкий доступ до комп’ютерів, ймовірно, був вирішальним для розробки їхніх методів ефективності методом проб і помилок і для надання своїх моделей клієнтам”, — написав він.

Він також зазначив, що рішення компанії випустити версію R1 свого чат-бота минулого тижня — перед інавгурацією нового президента США — виявилося політичним за своєю суттю. Він сказав, що це “явно мало на меті підірвати довіру громадськості до управління сферою ШІ у Сполучених Штатах у ключовий момент політики США”.

Дін Болл, науковий співробітник Mercatus Center Університету Джорджа Мейсона, також обережно поставився до заяв про те, що DeepSeek R1 перевернув ландшафт ШІ.

“Я вважаю, що Кремнієва долина та Волл-стріт реагують дещо надмірно, – сказав він Голосу Америки. – Але врешті-решт R1 означає, що конкуренція між США та Китаєм, швидше за все, залишатиметься жорсткою, і що нам потрібно сприймати це серйозно”.

Дебати щодо експортного контролю

Очевидний успіх DeepSeek був використаний деякими експертами як доказ того, що експортний контроль, запроваджений за адміністрації Байдена, міг не мати очікуваного ефекту.

“Як мінімум, це свідчить про те, що підходи США до штучного інтелекту та експортного контролю можуть бути не такими ефективними, як стверджують їхні прихильники”, — сказав Голосу Америки Пол Тріоло, партнер DGA-Albright Stonebridge Group.

“Наявність дуже хороших, але не найсучасніших графічних процесорів — наприклад, таких, які DeepSeek може оптимізувати для певного навчання та робочих навантажень, свідчить про те, що контроль над експортом може бути зосереджений на найсучаснішому обладнанні та моделях, – каже Тріоло – Тим не менш, залишається незрозумілим, як DeepSeek зможе йти в ногу з такими світовими лідерами, як OpenAI, Google, Anthropic, Mistral, Meta та інші, які й надалі матимуть доступ до найкращих апаратних систем”.

Інші експерти, однак, стверджували, що експортні обмеження просто діють недостатньо довго, щоб показати результати.

Сем Бреснік, науковий співробітник Центру безпеки та нових технологій Джорджтаунського університету, сказав Голосу Америки, що “дуже передчасно” називати ці заходи невдалими.

“Генеральний директор DeepSeek офіційно заявив, що найбільшим обмеженням, з яким вони стикаються, є доступ до обчислювальних ресурсів високого рівня, – сказав Бреснік. – Якби [DeepSeek] мав під рукою стільки обчислювальних ресурсів, скільки Google, Microsoft, OpenAI тощо, їх продуктивність значно підвищилася б. Тож… я не думаю, що DeepSeek — це те, про що стверджують деякі люди [щоб показати, що експортний контроль] не працює”.

Бреснік зазначив, що найжорсткіший експортний контроль був запроваджений лише у 2023 році, а це означає, що його наслідки, можливо, тільки починають відчуватися. Він сказав, що справжньою перевіркою його ефективності буде те, чи зможуть американські фірми продовжувати випереджати Китай у найближчі роки.

Дивіться також: Трамп демонструє рішучість у суперництві з Китаєм в розробці штучного інтелекту