Крупнейшая коллекция голосовых записей
05.02.2025

💼 MLCommons совместно с Hugging Face представила одну из крупнейших коллекций голосовых записей в открытом доступе, предназначенных для исследований в области ИИ.
Это набор данных под названием Unsupervised People’s Speech, который включает свыше миллиона часов аудио и охватывает не менее 89 различных языков.
Основные направления, которые планируется развивать благодаря базе:
🪬 улучшение моделей распознавания речи для языков с малым количеством ресурсов;
🪬 совершенствование распознавания речи с учетом различных акцентов и диалектов;
🪬 разработка новаторских приложений в области синтеза речи.