Мы используем файлы cookie на этом сайте, чтобы улучшить ваш пользовательский опыт.
Пожалуйста, ознакомьтесь с Политикой конфиденциальности для получения более подробной информации.

Информационно-аналитический центр непрерывного автоматизированного мониторинга редких, угрожающих и индикаторных видов животных (птиц).
Ю. Гецевич, Т. Шагова, Д. Белявский

Цель проекта – обеспечить автоматизированное распознавание голосовых сигналов животных (птиц) в режиме длительного круглосуточного и круглосезонного мониторинга видового разнообразия животных в выбранных местообитаниях и экосистемах.

Во всем мире существует более 10 000 видов птиц. Благодаря своей мобильности и различным потребностям к условиям обитания и к питанию птицы являются отличными индикаторами изменений биоразнообразия. Так, изменения в видовом составе, а также в численности птиц могут свидетельствовать об ухудшении экологического состояния окружающей среды, что может стать причиной исчезновения редких видов. Мониторинг состояния и тенденций биоразнообразия в экосистемах – нелегкая задача. И с помощью птиц, а именно их пения, исследователи могут улучшить свою способность отслеживать состояние и тенденции биоразнообразия в важных экосистемах, что позволит им лучше поддерживать глобальные усилия по сохранению.

Было бы хорошо иметь единую систему распознавания голосов птиц со всего мира, но эта задача пока достаточно сложна. Во-первых, количество видов птиц велико и каждый вид имеет уникальное пение и позывы, что приводит к широкому разнообразию звуков. Во-вторых, биоразнообразие значительно меняется в разных географических местах. Понятно, что видовой состав птиц в одном месте отличается от видового состава в другом. Более того, разные места имеют разные акустические среды, что приводит к разнообразию источников звуков, специфических для определенной территории. Поэтому решения для задачи распознавания голосов птиц обычно строятся локально. И для распознавания голосов основных видов птиц Беларуси была построена собственная система автоматизированного мониторинга птиц.

Набор данных для обучения нейросети подготовлен сотрудниками НПЦ НАН Беларуси по биоресурсам. Сами записи пения птиц собраны из собственных корпусов звуковых сигналов НПЦ НАН Беларуси по биоресурсам, а также из открытых источников (xeno-canto.org). Каждая аудиозапись была подробно аннотирована сотрудниками с указанием времени начала и конца звучания определенной птицы. Таким образом было аннотировано более 2000 аудиозаписей и получено более 37 000 аннотаций для 114 видов птиц.

В основе архитектуры нейросети, построенной для распознавания голосов птиц, лежит предобученная сверточная нейронная сеть EfficientNet. На вход модели подавались не сами звуковые сигналы, а их графические представления — мел-спектрограммы. Мел- спектрограмма сохраняет основные характеристики звука, в том числе его частоту и амплитуду. Эти спектрограммы строятся с использованием специальных фильтров и создают важную часть в анализе звуковых сигналов для распознавания птичьих голосов. Такое графическое представление позволяет нейросети научиться выявлять уникальные особенности, характерные для определенных видов птиц, и делать точные прогнозы по их голосам.

На данный момент точность модели распознавания составляет более 60% и постепенно увеличивается за счет увеличения объема данных для обучения и дополнительных методов предобработки звуковых сигналов. Ознакомиться с работой модели можно на официальном сайте центра bird-voice-iac.ssrlab.by.

Для заинтересованных. Общий путь «путешествия» аудиозаписи по просторам системы распознавания изображен в следующей схеме.