Удивительно доступная доступная модель ИИ Deepseek бросает вызов гигантам отрасли. Китайский стартап утверждает, что обучил свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что резко контрастирует со значительно более высокими затратами конкурентов. Эта, казалось бы, низкая цифра, однако, пропускает существенные расходы, такие как исследование, уточнение, обработка данных и инфраструктура.
Инновационный подход DeepSeek использует несколько ключевых технологий: многократный прогноз (MTP) для повышения точности и эффективности; Смесь экспертов (МО) с 256 нейронными сетями для ускоренного обучения и производительности; и мультиголовое скрытое внимание (MLA), чтобы сосредоточиться на важных элементах предложения.
Изображение: Ensigame.com
В отличие от публикаций Deepseek, полуанализ выявляет массовую вычислительную инфраструктуру, включающую приблизительно 50 000 графических процессоров Nvidia, включая H800, H100 и H20, распространяющиеся по нескольким центрам обработки данных. Общие инвестиции в сервер оцениваются в 1,6 млрд. Долл. США, при этом эксплуатационные расходы достигают 944 млн. Долл. США.
Изображение: Ensigame.com
DeepSeek, дочерняя компания Hedge Fund Hedge Fund, владеет своими центрами обработки обработки данных, в отличие от конкурентов-облаков, предоставляя ему больший контроль и более быструю реализацию инноваций. Его самофинансируемый статус способствует ловкости и быстрому принятию решений. Компания привлекает лучших талантов, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год, в основном из китайских университетов.
Изображение: Ensigame.com
Хотя требование DeepSeek в 6 миллионов долларов вводит в заблуждение, общие инвестиции превышают 500 миллионов долларов. Его бережливая структура обеспечивает эффективное развертывание инноваций, в отличие от более крупных, более бюрократических компаний. Успех компании зависит от существенных инвестиций, технологических достижений и квалифицированной команды.
Изображение: Ensigame.com
История Deepseek демонстрирует хорошо финансируемую независимую компанию по искусственному искусству, успешно конкурирующую с лидерами отрасли. Тем не менее, повествование о революционной экономической эффективности требует тонкого понимания, учитывая значительные общие инвестиции. Однако контраст остается резким: модель Diepseek R1 стоила 5 миллионов долларов на тренировку по сравнению с Catgpt4 на 100 миллионов долларов. Несмотря на разъясненные расходы, эффективность Deepseek по -прежнему представляет собой убедительную проблему для установленного порядка.