×

Китайский DeepSeek выпустил новые ИИ-модели с открытым кодом могут перевернуть мировой рынок

В последние месяцы на рынке искусственного интеллекта разгорелась настоящая борьба за лидерство, и теперь в нее активно включился китайский стартап DeepSeek. Компания представила сразу две новые модели ИИ — DeepSeek-V3.2 и ее продвинутую версию DeepSeek-V3.2-Speciale. Обе системы не только открыты для всех желающих, но и способны работать в реальных условиях, используя встроенные инструменты, что делает их особенно привлекательными для разработчиков и исследователей по всему миру.

DeepSeek не просто выпустил очередные нейросети — стартап бросил вызов американским гигантам вроде OpenAI и Google, которые традиционно держат свои самые мощные модели за закрытыми дверями и требуют немалых затрат на доступ. В отличие от них, DeepSeek сделал ставку на открытость: их модели распространяются по лицензии MIT, что позволяет свободно скачивать, модифицировать и даже использовать их в коммерческих целях. Такой подход может серьезно изменить расстановку сил в мировой гонке ИИ, ведь теперь даже небольшие команды или отдельные энтузиасты получают инструменты, которые раньше были доступны только крупным лабораториям с многомиллионными бюджетами.

Что касается возможностей, DeepSeek-V3.2 и ее специальная версия уже успели заявить о себе на международных соревнованиях. Модель Speciale, например, показала выдающиеся результаты на математических олимпиадах и конкурсах по программированию, обойдя по ряду показателей даже такие флагманы, как GPT-5 и Gemini 3 Pro. В частности, она набрала почти максимальные баллы на престижном турнире Гарварда и MIT, а также успешно справилась с задачами по поиску и исправлению ошибок в коде. Причем все это — без подключения к интернету и внешним сервисам.

В основе успеха DeepSeek лежит оригинальная архитектура, получившая название DeepSeek Sparse Attention (DSA). В отличие от классических трансформеров, которые анализируют каждое слово во входном тексте, DSA фокусируется только на ключевых фрагментах информации. Это позволяет существенно снизить вычислительные затраты — до 70% при работе с длинными текстами — и, соответственно, уменьшить стоимость эксплуатации. Для бизнеса и обычных пользователей это означает, что внедрение ИИ становится доступнее, а не остается прерогативой крупных корпораций.

Еще одна сильная сторона DeepSeek — умение работать с инструментами. Большинство современных ИИ-агентов теряются, когда нужно одновременно использовать несколько внешних сервисов или программных сред. DeepSeek решил эту проблему, внедрив механизм, который сохраняет память о действиях с каждым инструментом. Для обучения использовались десятки тысяч сложных сценариев, что позволило модели уверенно справляться с реальными задачами: от планирования сложных поездок до тестирования программного кода и анализа финансовых данных.

Однако открытость DeepSeek вызывает и опасения. Европейские регуляторы уже пытались ограничить распространение этих моделей из-за вопросов к безопасности данных, а в некоторых странах приложение даже временно блокировали. Американские власти также настороженно относятся к китайским ИИ-решениям, опасаясь утечки информации и геополитических рисков. Тем не менее, если оставить в стороне политические нюансы, DeepSeek предлагает рынку нечто действительно новое: высокую производительность, гибкость и минимальные затраты.

Пока что доступ к самой продвинутой версии DeepSeek ограничен, но уже в ближайшее время компания обещает сделать ее общедоступной. Если раньше искусственный интеллект ассоциировался с дорогими и закрытыми решениями, то теперь, похоже, начинается новая эра — эра доступного, мощного и по-настоящему открытого ИИ, где каждый может стать участником глобальной технологической гонки.

Александр Степанов

Запись перемещена в архив

Комментариев еще нет

Загрузка...
Нет больше статей