Найбуйнейшая калекцыя галасавых запісаў
05.02.2025

MLCommons сумесна з Hugging Face прадставіла адну з найбуйнейшых калекцый галасавых запісаў у адкрытым доступе, прызначаных для даследаванняў у галіне АІ.
Гэта набор даных пад назвай Unsupervised People’s Speech, які ўключае звыш мільёна гадзін аўдыя і ахоплівае не менш за 89 розных моў.
Асноўныя напрамкі, якія плануецца развіваць дзякуючы базе:
паляпшэнне мадэлей распазнавання маўлення для моў з малой колькасцю рэсурсаў;
♟ удасканаленне распазнавання маўлення з улікам розных акцэнтаў і дыялектаў;
распрацоўка наватарскіх дадаткаў у галіне сінтэзу маўлення.