Tencent представила новые модели машинного перевода

Tencent представила две новые модели для машинного перевода — HY‑MT1.5-1.8B и HY‑MT1.5-7B. Младшая модель сразу же заняла лидирующие позиции в трендах Hugging Face, в то время как старшая модель представляет собой серьезный шаг к созданию новой опенсорс SOTA в своей категории.

HY‑MT1.5-1.8B оптимизирована для использования на потребительском оборудовании; её размер составляет около 1 ГБ, а скорость генерации достигает 0,18 секунды на 50 токенов. Разработчики уверяют, что качество её перевода превосходит многие коммерческие API благодаря продвинутой дистилляции, где компактная модель учится на примерах более крупных аналогов.

HY‑MT1.5-7B предназначена для облачного использования и демонстрирует производительность, сопоставимую с 90-м процентилем таких закрытых решений, как Gemini 3.0 Pro. Обе модели поддерживают 33 языка и 5 диалектов, включая кантонский и тамильский, а также предлагают функции, такие как вмешательство в терминологию, контекстуальный перевод и сохранение форматирования.

Tencent также подготовила квантизированные версии моделей, что позволяет запускать их на различных устройствах — от серверов с GPU до современных ноутбуков. Для удобства облачного развёртывания уже доступен Docker-образ 7B-версии.

Помогите проекту, поделитесь с друзьями ;)

Добавить комментарий