Мы используем файлы cookie на этом сайте, чтобы улучшить ваш пользовательский опыт.
Пожалуйста, ознакомьтесь с Политикой конфиденциальности для получения более подробной информации.

Крупнейшая коллекция голосовых записей
05.02.2025

💼 MLCommons совместно с Hugging Face представила одну из крупнейших коллекций голосовых записей в открытом доступе, предназначенных для исследований в области ИИ.

Это набор данных под названием Unsupervised People’s Speech, который включает свыше миллиона часов аудио и охватывает не менее 89 различных языков.

Основные направления, которые планируется развивать благодаря базе:

🪬 улучшение моделей распознавания речи для языков с малым количеством ресурсов;
🪬 совершенствование распознавания речи с учетом различных акцентов и диалектов;
🪬 разработка новаторских приложений в области синтеза речи.

 

Источник