Arcee, лаборатория из Сан-Франциско, представила новую текстовую reasoning-модель под названием Trinity-Large-Thinking, которая насчитывает 399 миллиардов параметров. Эта модель распространяется под лицензией Apache 2.0, что даёт возможность как независимым разработчикам, так и крупным компаниям свободно её использовать и модифицировать. Trinity-Large-Thinking была разработана как альтернатива закрытым моделям, доминирующим на рынке. Релиз модели совпал с ростом обеспокоенности компаний по поводу использования китайских архитектур в критически важных инфраструктурах. Arcee предлагает разработчикам инструмент, который они могут полностью контролировать.

Arcee — это небольшая команда из 30 человек, которая выделяется своим подходом "инженерия через ограничения". В 2026 году компания инвестировала 20 миллионов долларов, что составляет почти половину её бюджета, в 33-дневный цикл обучения модели Trinity-Large. Для этого использовался кластер из 2048 GPU NVIDIA B300 Blackwell, что позволило достичь высокой скорости обучения. Модель отличается редкой архитектурой Mixture-of-Experts, где из 400 миллиардов параметров активны только 1,56% (13 миллиардов) для каждого токена, что обеспечивает высокую скорость и эффективность работы. Для решения проблем стабильности Arcee разработала механизм SMEBU (Soft-clamped Momentum Expert Bias Updates), который равномерно распределяет нагрузку между экспертами.

Обучение Trinity-Large включало 20 триллионов токенов, половина из которых была синтетическими данными, созданными с помощью переработки текстов. Такой подход позволил модели лучше понимать концепции и информацию, а не просто запоминать текст. Ключевым обновлением Trinity-Large-Thinking стала фаза "мышления" перед генерацией ответа, что улучшило способность модели выполнять сложные многошаговые задачи и обеспечило стабильность в долгосрочных сценариях. На тестах PinchBench модель набрала 91.9 балла, что близко к лидеру рынка Claude Opus 4.6 с 93.3 балла.

Лицензия Apache 2.0 выделяет Trinity-Large-Thinking среди конкурентов, предоставляя предприятиям возможность полного контроля над моделью. Arcee также выпустила Trinity-Large-TrueBase — контрольную точку с 10 триллионами токенов, которая позволяет полностью адаптировать модель под свои нужды. Trinity-Large-Thinking уже получила положительные отзывы сообщества. На платформе OpenRouter модель стала самой популярной в США, обработав более 80 миллиардов токенов за день. При стоимости $0.90 за миллион токенов Trinity значительно дешевле конкурентов, таких как Claude Opus 4.6, который стоит $25 за миллион токенов. Arcee планирует использовать наработки Trinity-Large для обновления своих компактных моделей Mini и Nano, открыв их для широкого круга пользователей.

Источник

Написать комментарий