DeepSeek R1 — що таке дешевий конкурент ChatGPT від OpenAI

Автор: Михайленко А.

Для розробки ChatGPT компанія Open AI тільки на старті залучила $1 млрд інвестицій. І ще багато мільярдів — вже після своїх перших успіхів у створенні великих мовних моделей (тільки Microsoft виділили $10 млрд!). А у 2023-му стало відомо, що ChatGPT щодня обходиться своїм творцям у $700 тисяч. До січня 2025-го всі думали, що такі великі витрати не є чимось екстраординарним. А потім з’явився DeepSeek (а точніше, модель DeepSeek R1) — дешевий китайський чат-бот, який на перший погляд не поступається у функціональності ChatGPT і його основним конкурентам. Як вийшло, що маловідомому китайському стартапу вдалося зробити неймовірне — похитнути трон під США, які дотепер вважалися технологічною столицею світу і лідером в AI-технологіях?

Найголовніше про DeepSeek
Можливості та переваги чат-бота DeepSeek
Як DeepSeek вплине на ринок AI

Найголовніше про DeepSeek

Модель DeepSeek R1 було запущено на початку січня 2025 року — тоді розробники похвалилися в мережі X, що вона справляється із завданнями не гірше, ніж ChatGPT. А саме, може так само писати програмний код, розв’язувати математичні задачі, міркувати на задані користувачем теми й жартувати. І все це — абсолютно безкоштовно!

Стартап DeepSeek заснував 2023 року китаєць Лян Веньфен, який зробив ставку на високопродуктивні графічні процесори та закупив тисячі чипів Nvidia до того, як їхній експорт зі США до Китаю було заборонено. Наразі процесори Nvidia забезпечують роботу DeepSeek одночасно із дешевшими графічними чипами, однак за іншими даними перших у DeepSeek може бути набагато більше, ніж вони заявляють. Це викликає питання про те, чи справді санкції США у стримуванні китайського прогресу в AI ефективні або ж їх можна обійти.

У Nvidia описали нову розробку як «чудове досягнення ШІ», а генеральний директор OpenAI Сем Альтман написав, що «R1 від DeepSeek — вражаюча модель». Саму появу DeepSeek називають «моментом супутника» — за аналогією з першим супутником, запущеним у космос СРСР 1957 року.

Можливості та переваги чат-бота DeepSeek

DeepSeek R1 — модель штучного інтелекту з відкритим вихідним кодом, яка з’явилася як сторонній проєкт, але зуміла зробити революцію. Ось основні складники її успіху:

була навчена на понад 2000 відеокартах Nvidia H800 за 55 днів при вартості за $5,6 млн — це в рази менше, ніж витратили на аналогічні рішення найбільші західні компанії;
запускає внутрішні процеси пошуку оптимального використання графічних чипів, щоб отримати результат із найменшим залученням ресурсів (так зване розподілене навчання або Distributed Training);
використовує навчання з підкріпленням (reinforcement learning, RL), яке передбачає винагороду за правильні відповіді й покарання за неправильні;
не передбачає будь-яких лімітів на кількість запитів і не знижує продуктивності при інтенсивному навантаженні;
перевершує конкурентів в основних бенчмарках — AIME 2024, MMLU і AlpacaEval 2.0.

Крім технічних аспектів є й важливі етичні моменти. Оскільки DeepSeek розроблена китайцями і для китайців, вона цензурує заборонені у цій країні теми — переважно політично чутливий контент. Але це не так важливо, як те, що мобільний застосунок DeepSeek, імовірно, зберігає великі обсяги даних на китайських серверах, що може стати загрозою конфіденційності для жителів США, Європи та низки інших країн. З іншого боку, відкритий вихідний код моделі R1 дає змогу запускати її таким чином, щоб уникнути надсилання даних до Китаю.

Як DeepSeek вплине на ринок AI

Назва DeepSeek уперше голосно прозвучала на Всесвітньому економічному форумі в Давосі, що стартував 20 січня 2025 року. Спочатку її згадали в контексті того, що США слід подвоїти свої зусилля з розвитку AI, а великий інвестор і IT-підприємець Марк Андерссен назвав модель DeepSeek «одним із найдивовижніших і найбільш вражаючих проривів», які він коли-небудь бачив. Уже на третю добу роботи форуму DeepSeek очолив чарти із завантажень в iPhone Apple Inc. і опинився серед лідерів у Google Play. Ринки відреагували негайно: за кілька днів вартість акцій американських і європейських технологічних компаній впала майже на $1 трлн — тільки одна Nvidia Corp. втратила близько $589 млрд (18%) за один понеділок, але пізніше частково відновилася. Істотних втрат також зазнали компанії Microsoft і Alphabet (Google).

Чи зможе DeepSeek скласти реальну конкуренцію найбільшим гравцям AI-ринку — ще належить дізнатися. Однак основні технологічні гіганти вже мають намір переглянути свої цінові політики і зрозуміти, чи дійсно виправдані їхні величезні витрати на штучний інтелект. Наприклад, для цього Meta Platforms Inc. зібрала внутрішню команду для детального аналізу DeepSeek — він дасть змогу зрозуміти, як було створено модель і на що вона насправді здатна. Водночас Ілон Маск, у якого є власна AI-компанія xAI, висловив скептицизм щодо DeepSeek — він підозрює, що у стартапа було набагато більше графічних процесорів Nvidia, ніж заявляють розробники.

Нагадаємо, що ажіотаж навколо DeepSeek виник на тлі того, як технологічні гіганти продовжують витрачати мільярди доларів на свої AI-проєкти. Наприклад, тільки 2024 року Amazon інвестувала $75 млрд у комп’ютерні чіпи та центри обробки даних, які обслуговують AI-навантаження. Також $65 млрд на проєкти, пов’язані зі штучним інтелектом, планує виділити Meta. А Microsoft на центри обробки даних для AI — ще $80 млрд. Значна частина цих витрат йде на закупівлю дорогих чіпів Nvidia. При цьому перераховані компанії натрапили на труднощі в монетизації своїх AI-продуктів і не отримують тієї фінансової віддачі, на яку розраховували.

Ще одна велика стаття видатків — витрати на інфраструктуру дата-центрів. Тільки за 2024 рік основна трійка американських гіперскейлерів витратила на це понад $180 млрд, а якщо додати сюди витрати операторів ДЦ (один із найбільших у їхньому списку — Equinix), ця сума щонайменше потроїться. Зростання витрат, ймовірно, продовжиться, як і введення в експлуатацію нових обчислювальних потужностей. На них зберігається високий попит, а кількість потужностей, які не задіяні, у США не перевищує 2,8% — це неймовірно низький показник. Також нещодавно Марк Цукерберг, CEO Meta, заявив про плани побудувати новий ДЦ із ШІ «таких розмірів, що він займе значну частину Мангеттена, якщо його там розмістити». Основна відмінність інтелектуально керованих дата-центрів від звичайних — кількість споживаної енергії в перерахунку на квадратний метр площі.

Водночас інвестиції в ДЦ, які досягли неймовірних розмірів, можуть на тлі появи DeepSeek, оскільки багато інвесторів намагаються розібратися, чи дійсно виправдані такі високі витрати. Плюс є точкові обмеження, не пов’язані з появою DeepSeek — наприклад, менше дозволів і навіть мораторії на будівництво нових ДЦ в окремих містах.

Бурхливий дебют DeepSeek змусив основних учасників глобального ринку звернути увагу на інші китайські AI-стартапи, кількість яких стрімко зростала весь час після анонсу ChatGPT. Крім великих і давно відомих Alibaba і ByteDance у Китаї існує багато інших амбітних АІ-проектів. Основні з них відомі як Six Tigers («шість тигрів»): це Stepfun, Zhipu, Minimax, Moonshot, 01.AI і Baichuan. Ще один проєкт за специфікою роботи максимально наближений до DeepSeek — це ModelBest. А трохи менш відомі Minimax і Moonshot займаються створенням користувацьких застосунків на основі моделей, розроблених сторонніми компаніями. З погляду світових IT-гігантів будь-який із цих стартапів може стати черговим викликом, тим паче, що багато хто з них фінансово успішний: та ж Minimax тільки за підсумками минулого року отримала виручку в розмірі $70 млн.

А поки розробники в усьому світі почали експериментувати з DeepSeek і роблять перші спроби створити ефективні інструменти на його базі, у самому стартапі шукають можливість масштабуватися — заборона на експорт зі США топових графічних чипів усе ще в силі. У будь-якому разі, поява DeepSeek уже змінила ринок технологій і зміцнила вплив Китаю у світовій AI-індустрії.

Допоможіть нам, стати краще! Наскільки корисний цей пост?

Будь ласка, оцініть цей матеріал, натиснувши на зірочки нижче!

Середній рейтинг 4.8 / 5. Кількість оцінок: 6

No votes so far! Be the first to rate this post.