HY-1.8B-2Bit — LLM, которая помещается в смартфон

Tencent открыли исходники HY-1.8B-2Bit — сверхэффективной языковой модели, оптимизированной для работы прямо на устройстве.

Главная идея — максимально снизить размер без серьёзной потери качества.

Что внутри

Ключевые технологии

Ultra-Low-Bit (2-bit) — используется Quantization-Aware Training (QAT)
Dual Chain-of-Thought — сохранено сложное рассуждение даже при экстремальном сжатии
Оптимизация под железо — Arm SME2 и современные мобильные чипы

Производительность

Почему это важно

Локальные AI-ассистенты без облака становятся реальностью:

Форматы

Проект: https://t.me/BusinessNetwork_robot?start=G7X296

Веса: https://t.me/BusinessNetwork_robot?start=G7X296

GGUF: https://t.me/BusinessNetwork_robot?start=G7X296-GGUF

Technical report: https://t.me/BusinessNetwork_robot?start=G7X296/blob/main/AngelSlim_Technical_Report.pdf

#Tencent

Наш Телеграм канал: https://t.me/bninstrum

Канал VK: https://vk.ru/club195425868

HY-1.8B-2Bit: Языковая модель для смартфонов от Tencent