
Canopy Labs прадстаўляе Orpheus, сямейства самых сучасных маўленчых LLM для стварэння выразнага маўлення на ўзроўні чалавека.
Мадэль выкарыстоўвае Llama-3b у якасці асновы. Яна навучана на больш чым 100 тысячах гадзін маўленчых даных на англійскай мове і мільярдах тэкставых маркераў. Навучанне на тэкставых токенах павышае яе прадукцыйнасць пры выкананні задач TTS, таму што яна падтрымлівае выдатнае разуменне мовы.
🦻 TTS падтрымлівае паток выхаду ў рэальным часе з вельмі нізкай затрымкай каля ~ 200 мс. Для яшчэ больш нізкай затрымкі ўваходны паток тэксту ў кэш KV мадэлі можа паменшыць затрымку да ~25-50 мс.