Тем не менее, это все еще дешевле, чем его конкуренты.
Новый чат -бот из DeepSeek предстал перед мне с этим увлекательным описанием:
Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас.
Сегодня искусственный интеллект Deepseek стал грозным конкурентом на рынке, в частности, в значительной степени способствовало одному из крупнейших цен на акции Nvidia.
Изображение: Ensigame.com
Что отличает эту модель, так это ее инновационная архитектура и методы обучения. Он использует несколько передовых технологий:
Multi-Token Production (MTP): этот подход позволяет модели прогнозировать несколько слов одновременно, анализируя различные части предложения, повышая как точность, так и эффективность.
Смесь экспертов (MOE): в модели DeepSeek используется разнообразный набор нейронных сетей для обработки входных данных. Эта архитектура ускоряет обучение ИИ и повышает производительность. В DeepSeek V3 используются 256 нейронных сетей, с восемью активированными для каждой задачи обработки токена.
Многопользовательское скрытое внимание (MLA): этот механизм помогает ИИ сосредоточиться на наиболее значимых частях предложения. Повторно извлекая ключевые детали из фрагментов текста, MLA снижает риск отсутствия важной информации, позволяя ИИ лучше захватывать важные нюансы во входных данных.
Ведущий китайский стартап DeepSeek может похвастаться тем, что они создали высококонкурентную модель ИИ с минимальными затратами, утверждая, что потратили всего 6 миллионов долларов на обучение DeepSeek V3, используя только 2048 графических процессоров.
Изображение: Ensigame.com
Тем не менее, аналитики полуанализа показали, что DeepSeek управляет существенной вычислительной инфраструктурой, включающей около 50 000 графических процессоров Nvidia Hopper. Это включает в себя 10 000 единиц H800, 10 000 продвинутых H100 и дополнительных графических процессоров H20. Эти ресурсы распространяются по нескольким центрам обработки данных и используются для обучения, исследований и финансового моделирования искусственного интеллекта.
Общие инвестиции компании в серверы составляют приблизительно 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США.
DeepSeek является дочерней компанией китайского хедж-фонда High-Flyer, который отключился от стартапа в качестве отдельного подразделения, ориентированного на AI в 2023 году. В отличие от большинства стартапов, которые полагаются на облачных поставщиков, Deepseek владеет своими центрами обработки данных, обеспечивая полный контроль над оптимизацией модели ИИ и обеспечивая быстрые инновации. Компания остается самофинансированной, повышая свою гибкость и скорость принятия решений.
Изображение: Ensigame.com
Более того, некоторые исследователи в DeepSeek зарабатывают более 1,3 миллиона долларов в год, привлекая лучших талантов от ведущих китайских университетов (компания не нанимает иностранных специалистов).
Учитывая эти факты, утверждение Deepseek о обучении своей последней модели всего за 6 миллионов долларов кажется нереалистичным. Эта цифра охватывает только стоимость использования графических процессоров во время предварительного обучения и не включает расходы на исследования, уточнение модели, обработку данных или общие затраты на инфраструктуру.
С момента своего создания DeepSeek инвестировала более 500 миллионов долларов в разработку ИИ. Тем не менее, его бережливая структура позволяет ему внедрять инновации искусственного интеллекта более активно и эффективно, чем более крупные, более бюрократические компании.
Изображение: Ensigame.com
Пример DeepSeek иллюстрирует, что хорошо финансируемая независимая компания ИИ действительно может конкурировать с отраслевыми гигантами. Тем не менее, эксперты отмечают, что успех компании обусловлен миллиардами инвестиций, технических прорывов и сильной командой, в то время как заявления о «революционном бюджете» для разработки модели ИИ несколько преувеличены.
Тем не менее, затраты DeepSeek остаются ниже, чем у его конкурентов. Например, Deepseek потратил 5 миллионов долларов на R1, а Chatgpt4o стоил 100 миллионов долларов на обучение.