В начале 2025 года, когда DeepSeek-V3 поразил мировое AI-сообщество своей беспрецедентной эффективностью обучения, эта молодая AI-компания снова привлекла всемирное внимание. Как дочерняя компания HuanFang Technology, DeepSeek трансформировалась из неизвестного стартапа в мирового технологического лидера всего за восемнадцать месяцев.
HuanFang Technology: От количественной торговли к AI-инновациям
В здании Huijin International в Ханчжоу, с видом на исторический Великий канал, команда под руководством основателя 80-х годов рождения Лян Вэньфэна организует технологическую революцию. Это место рождения DeepSeek, возникшего из гиганта количественной торговли HuanFang Technology.
Основанная в 2016 году, HuanFang Technology зарекомендовала себя как ведущий количественный хедж-фонд Китая. Используя свой глубокий опыт в ИИ и количественной торговле, компания начала позиционировать себя для выхода на рынок больших языковых моделей еще в 2022 году. Во время острого дефицита чипов HuanFang дальновидно обеспечила себе 10,000 GPU A100, заложив прочный фундамент для рождения DeepSeek.
Уникальный технический подход: Фокус на оригинальных инновациях
В отличие от других китайских AI-компаний, DeepSeek выбрал особый путь развития. Основатель Лян Вэньфэн твердо верит, что китайские AI-предприятия не должны оставаться вечными последователями, а должны вносить вклад в глобальную волну технологических инноваций.
Эта вера отражается в каждом важном решении компании. Среди семи ведущих китайских AI-стартапов по разработке моделей DeepSeek выделяется своим исключительным фокусом на исследованиях и технологиях без преследования потребительских приложений. Это также единственная компания, которая не приоритизировала коммерциализацию, вместо этого твердо придерживаясь открытого исходного кода и избегая внешнего финансирования.
Прорывные технические инновации
Технические инновации DeepSeek проявляются в основном в двух областях: архитектурные инновации и прорывы в методологии обучения.
В архитектурном плане, пионерский механизм MLA (Multi-head Latent Attention) компании снижает использование памяти до 5-13% от традиционной архитектуры MHA. Эта инновация возникла из идеи молодого исследователя и была реализована благодаря месяцам командной работы. Кроме того, архитектура DeepSeekMoE значительно снижает вычислительные требования.
В методологии обучения DeepSeek стал пионером в смешанной точности FP8 с оптимизированными стратегиями обработки данных. Эти инновации позволили DeepSeek-V3 завершить обучение всего на 2,048 GPU менее чем за два месяца, при общей стоимости $5.5 миллионов - примерно одна двадцатая стоимости обучения GPT-4o.
Молодая инновационная команда
DeepSeek может похвастаться уникальной исследовательской командой. Основные технические позиции в основном заняты недавними выпускниками и специалистами с опытом работы 1-2 года, в то время как руководители команд обычно имеют 4-6 лет опыта. Эти молодые таланты из ведущих университетов, таких как Цинхуа и Пекинский университет, процветают в плоской структуре управления компании и инновационной атмосфере.
В DeepSeek любой может свободно получить доступ к ресурсам тренировочного кластера без одобрения. Когда у исследователя появляется идея, он может немедленно сформировать команды с заинтересованными коллегами. Этот гибкий механизм инноваций позволил реализовать множество прорывных идей.
Философия открытого исходного кода
Как инновационное предприятие, инкубированное HuanFang Technology, DeepSeek унаследовал гены практических инноваций своей материнской компании, развивая при этом собственные характеристики. Компания придерживается подхода с открытым исходным кодом, считая, что преимущества, созданные закрытыми системами, временны перед лицом прорывных технологий.
DeepSeek встраивает ценность в свою команду, способствуя развитию всей AI-экосистемы через открытый исходный код. Лян Вэньфэн считает, что "открытый исходный код - это больше культурное поведение, чем коммерческое. Отдавать - это дополнительная честь."
Глобальные технические амбиции
В волне ИИ, во многом движимой Кремниевой долиной, DeepSeek представляет редкий обратный случай. Его инновация архитектуры MLA была высоко оценена главным аналитиком SemiAnalysis как "потенциально лучшая статья этого года", в то время как бывшие сотрудники OpenAI высоко оценили его "удивительно мудрую" настройку обучения.
Как ключевая AI-инициатива HuanFang Technology, DeepSeek демонстрирует, что китайские технологические компании полностью способны вносить вклад на глобальном инновационном фронтире. От простых последователей технологий до активных участников инноваций, эта молодая компания пишет новую главу в AI-индустрии Китая.
Перспективы на будущее
Смотря вперед, DeepSeek стремится стать ведущим мировым поставщиком базовых моделей. Компания надеется сформировать полную промышленную экологию через непрерывные технологические инновации, позволяя большему числу предприятий строить B2B и B2C бизнес на основе DeepSeek.
От корней количественной торговли HuanFang Technology до текущего расширения на границе ИИ, DeepSeek иллюстрирует эволюцию китайских технологических компаний от 1 до N, а затем от 0 до 1. Эта история продолжает разворачиваться, и сочетание HuanFang Technology и DeepSeek, несомненно, напишет замечательную главу в эпоху ИИ.