Інфармацыйна–аналітычны цэнтр бесперапыннага аўтаматызаванага маніторынгу рэдкіх, пагражальных і індыкатарных відаў жывёл (птушак).

Даследаванні / Інфармацыйна–аналітычны цэнтр бесперапыннага аўтаматызаванага маніторынгу рэдкіх, пагражальных і індыкатарных відаў жывёл (птушак).

Ю. Гецэвіч, Т. Шагава, Дз. Бяляўскі

Мэта праекта — забеспячэнне аўтаматызаванага распазнавання галасавых сігналаў жывёл (птушак), у рэжыме доўгачасовага кругласутачнага і кругласезоннага маніторынгу відавой разнастайнасці жывёл у абраных месцапражываннях і экасістэмах.

Больш за 10000 відаў птушак існуе па ўсім свеце. Дзякуючы сваёй мабільнасці і розным патрабаванням да ўмоў пражывання і да сродкаў харчавання, птушкі з’яўляюцца выдатнымі індыкатарамі змены біяразнастайнасці. Так, змены ў відавым складзе, а таксама ў колькасці птушак, могуць быць сведкамі пагаршэння экалагічнага стану навакольнага асяроддзя, што можа стаць прычынай знікнення рэдкіх відаў. Маніторынг стану і тэндэнцый біяразнастайнасці ў экасістэмах – нялёгкая задача. І з дапамогай птушак, а менавіта іх спеваў, даследчыкі могуць палепшыць сваю здольнасць адсочваць стан і тэндэнцыі біяразнастайнасці ў важных экасістэмах, што дазволіць ім лепш падтрымліваць глабальныя намаганні па захаванні.

Было б добра мець адзіную сістэму распазнавання галасоў птушак з усяго свету, але гэтая задача пакуль досыць складаная. Па-першае, колькасць відаў птушак вялікая і кожны від мае унікальныя спевы і пазыўкі, што прыводзіць да шырокай разнастайнасці гукаў. Па-другое, біяразнастайнасць значна мяняецца ў розных геаграфічных месцах. Зразумела, што відавы склад птушак у адным месцы адрозніваецца ад відавога складу ў другім. Больш таго, розныя месцы маюць розныя акустычныя асяроддзі, што прыводзіць да разнастайнасці крыніц гукаў, спецыфічных для пэўнай тэрыторыі. Таму рашэнні для задачы распазнавання галасоў птушак звычайна будуюцца лакальна. І для рапазнавання галасоў асноўных відаў птушак Беларусі была пабудавана ўласная сістэма аўтаматызаванага маніторынгу птушак.

Набор даных для навучання нейрасеткі падрыхтаваны супрацоўнікамі НПЦ НАН Беларусі па біярэсурсах. Самі запісы спеваў птушак былі сабраныя з уласных карпусоў гукавых сігналаў НПЦ НАН Беларусі па біярэсурсах, а таксама з адрытых крыніц (xeno-canto.org). Кожны аўдыязапіс быў падрабязна анатаваны супрацоўнікамі з пазнакамі часу пачатка і канца гучання пэўнай птушкі. Такім чынам было анатавана больш за 2000 аўдыязапісаў і атрымана больш за 37000 анатацый для 114 відаў птушак.

У аснове архітэктуры нейрасеткі, пабудаванай для распазнавання галасоў птушак, ляжыць пераднавучаная згорткавая нейронная сетка EfficientNet. На ўваход мадэлі падаваліся не самі гукавыя сігналы, а іхнія графічныя ўяўленні, мел-спектраграмы. Мел-спектраграма захоўвае асноўныя характарыстыкі гуку, у тым ліку яго частату і амплітуду. Гэтыя спектраграмы будуюцца з ужываннем спецыяльных фільтраў і ўтвараюць важную частку ў аналізе гукавых сігналаў для распазнання птушыных галасоў. Такое графічнае ўяўленне дазваляе нейрасетцы навучыцца выяўляць унікальныя асаблівасці, характэрныя для пэўных відаў птушак, і рабіць дакладныя прагнозы па іх галасам.

На даны момант дакладнасць мадэлі распазнавання складае больш за 60% і паступова павялічваецца за кошт павялічэння аб’ёма даных для навучання і дадатковых метадаў перадапрацоўкі гукавых сігналаў. Азнаёміцца з працай мадэлі можна на афіцыйным сайце цэнтра bird-voice-iac.ssrlab.by.

Для зацікаўленых. Агульны шлях “падарожжа” аўдыязапіса па прасторах сістэмы распазнавання адлюстраваны ў наступнай схеме.

Ранейшае даследаванне Раней Наступнае даследаванне Далей