DeepSeek выпустила DSpark: открытый фреймворк для ускорения инференса LLM на 85%

Создатели популярной модели DeepSeek представили фреймворк DSpark под открытой лицензией MIT. Благодаря алгоритмам спекулятивного декодирования инструмент ускоряет инференс больших языковых моделей на величину до 85%, снижая задержки и нагрузку на серверы.

В условиях дефицита и высокой стоимости вычислительных мощностей для работы искусственного интеллекта китайская исследовательская лаборатория DeepSeek продолжает выпускать эффективные решения с открытым кодом. Последней разработкой компании стал проект DSpark.

Суть технологии спекулятивного декодирования

DSpark основан на методе спекулятивного декодирования (speculative decoding). В этой схеме параллельно работают две модели: легкая вспомогательная (draft model) быстро генерирует варианты токенов, а крупная основная модель (target model) проверяет их за один проход. Это позволяет значительно снизить количество обращений к памяти видеокарт, являющееся главным узким местом при генерации текста.

Сокращение затрат на инфраструктуру

Согласно результатам тестов, применение DSpark позволяет ускорить время отклика (time-to-first-token и общую генерацию) больших языковых моделей на величину до 85%. Для бизнеса и разработчиков это означает возможность существенно снизить затраты на хостинг ИИ-моделей, используя менее мощные серверы для достижения той же скорости работы.

Источники

Случайные статьи

Статья Создатель Dead or Alive сумел договориться с Tecmo добавлена с разрешения редакции сайта Игромания.Автор: Андрей Чаплюк. В одном из самых громких скандалов в истории игровой...

Просматривая запросы в сети, а именно, что людям требуется из программ заметил - запросы, которые пишут в поисковике довольно сильно отличаются от тех запросов по которым проще най...

Статья Тайны прошлого Микки Мауса добавлена с разрешения редакции сайта Игромания.Автор: Андрей Чаплюк. Казалось бы, Epic Mickey – игра, которая идеально подходит для аудитории N...

Статья Toshiba отправила кресло в космос добавлена с разрешения редакции сайта Игромания.Автор: Павел Шубский. Японская компания Toshiba решила красиво прорекламировать новую лине...

Статья На GT300 можно запустить операционную систему? добавлена с разрешения редакции сайта Игромания.Автор: Павел Шубский. В разговоре с вице-президентом NVIDIA по контенту колле...