Мы выкарыстоўваем файлы cookie на гэтым сайце для паляпшэння вашага вопыту карыстання.
Для больш падрабязнай інфармацыі азнаёмцеся з Палітыка канфідэнцыяльнасці

Распазнаванне маўлення
AI
Апрацоўка гуку
Класіфікацыя гукаў
AudioMNIST
26.02.2025

Набор даных audioMNIST утрымлівае 30 000 запісаў на англійскай мове і 10 лічбаў ад 0 да 9. У стварэнні датасэта прымалі ўдзел 60 дыктараў, з іх 12 жанчын і 48 мужчын, з рознымі акцэнтамі і краінамі паходжання. Іх узрост вар’іруецца ад 22 да 61 года. Дадзены датасэт падыходзіць для простых задач класіфікацыі аўдыя: класіфікацыя лічбаў ці класіфікацыя пола чалавека.

Асаблівасці даных:
палавая прыналежнасць у наборы даных незбалансаваная: каля 80% – мужчыны;
большасць дыктараў (каля 70%) маюць нямецкі акцэнт;
кожнаму дыктару адпавядае адна тэчка ў датасэце;
дадаткова ў файле “audioMNIST_meta.txt” утрымліваецца метаінфармацыя, такая як пол, узрост, нацыянальнасць і г. д.

Акрамя запісаў у рэпазіторыі па спасылке таксама прыводзяцца дзве навучаныя на гэтым датасэце мадэлі.

Спасылка на датасэт

Артыкул