Глыбокая нейронная сетка архітэктуры трансформер для ацэнкі і прагнозу параметраў стану экасістэм на тэрыторыях з высокім узроўнем радыеактыўнага забруджвання

Даследаванні / Глыбокая нейронная сетка архітэктуры трансформер для ацэнкі і прагнозу параметраў стану экасістэм на тэрыторыях з высокім узроўнем радыеактыўнага забруджвання

А. М. Нікіцін, І. А. Чэшык, Я. В. Мішчанка, Д. В. Сухарава, В. А. Шуранкова, М. У. Кудзін, С. А. Калінічэнка

Параметры назапашвання 137Cs у кампанентах лясных экасістэм маюць высокую варыябельнасць і складаную залежнасць ад фактараў навакольнага асяроддзя, што абцяжарвае прагноз адпаведнасці драўніны на тэрыторыях з высокім узроўнем радыеактыўнага забруджвання санітарна-гігіенічным нарматывам. З мэтай вырашэння гэтай праблемы праведзена ацэнка магчымасці выкарыстання мультыспектральных спадарожнікавых здымкаў для ацэнкі каэфіцыента пераходу радыеактыўнага ізатопа цэзія ў драўніну.

Мультыспектральные даныя спадарожнікавага абследавання зямлі ў цяперашні час актыўна выкарыстоўваюцца для ацэнкі розных аспектаў стану расліннага і глебавага покрыва: тып расліннага покрыва, біялагічная прадуктыўнасць і стрэс раслін, тып глебы, забяспечанасць элементамі харчавання і вільгацезабяспечанасць, запасы арганічнага рэчыва ў глебе і іншыя параметры стану. Спектральны водгук расліннага покрыва ўскосна адлюстроўвае глебавыя характарыстыкі, а таксама можа выкарыстоўвацца для аналізу стану раслін. На падставе гэтага зроблена здагадка аб тым, што мультыспектральные даныя дыстанцыйных назіранняў можна выкарыстоўваць для ацэнкі параметраў мадэлі прагнозу назапашвання радыеактыўных рэчываў у раслінах. У прыватнасці, уяўляе цікавасць ацэнка магчымасці выкарыстання даных Sentinel-2 для прагнозу назапашвання 137Cs у драўніне хвоі, якая расце ў Палескім дзяржаўным радыяцыйна-экалагічным запаведніку.

Выкарыстанне глыбокіх нейронных сетак дазваляе аўтаматызаваць задачу пошуку і канструявання ўваходных параметраў мадэляў. Дадзеная задача вырашаецца адначасова з навучаннем мадэлі. Схаваны пласт або пласты мадэлі можна разглядаць у якасці схаванага прадстаўлення (embedding), якое з’яўляецца вектарам у віртуальнай шматмернай прасторы магчымых станаў мадэліруемай сістэмы.

Аўтарамі зроблена здагадка, што сукупнасць спектраў адлюстравання ў бачным і інфрачырвоным дыяпазонах паверхні экасістэмы, атрыманых у розныя моманты часу, нясе ў сабе інфармацыю аб яе стане, уключаючы відавы склад, значэнні эдафічных, кліматычных, біятычных і антрапагенных фактараў і т.п. Гэта інфармацыя можа быць выкарыстана ў тым ліку і для вызначэння параметраў назапашвання тэхнагенных радыенуклідаў у кампанентах экасістэмы. З іншага боку, часавы набор фрагментаў мультыспектральных спадарожнікавых малюнкаў паверхні экасістэмы можа выкарыстоўвацца для кадавання вектара схаванага прадстаўлення экасістэмы. Навучанне мадэлі для яго вылічэння можа ажыццяўляцца без настаўніка з выкарыстаннем калекцыі здымкаў спадарожнікавых назіранняў за паверхняй Зямлі.

На дадзены момант адной з найбольш дасканалых архітэктур глыбокіх нейронных сетак для вырашэння шырокага круга задач з’яўляюцца трансформеры, пабудаваныя на аснове механізму аўтаўвагі. У аглядзе Ghaffarian і інш. было паказана, што механізм увагі, як правіла, паляпшае паказчыкі мадэляў для апрацоўкі малюнкаў дыстанцыйнага зандзіравання. Мультыспектральнае ўяўленне паверхні натуральных экасістэм мае выяўленыя заканамернасці часовай дынамікі як сезоннай, так і больш працяглай, абумоўленай сукцэссіённымі працэсамі. Спектральная дынаміка змяшчае вялікі аб’ём семантычнай інфармацыі, якая мае свой выраз у краявідных, феналагічных і іншых асаблівасцях раслінных супольнасцяў. Гэта палажэнне было наглядна паказана ў працы Yuan і Lin, якія стварылі мадэль, заснаваную на некалькіх пластах трансформераў, для семантычнай класіфікацыі аб’ектаў на спадарожнікавых мультыспектральных здымках, што здабываюць значныя спектральна-часовыя структуры, у працэсе навучання без настаўніка з маскіраваннем выпадковых элементаў у часовай паслядоўнасці. Навучаная на аднаўленні гэтых элементаў глыбокая нейронная сетка ў далейшым адносна лёгка данавучаецца на абмежаваным наборы размечаных даных для вырашэння задачы семантычнай класіфікацыі.

У мадэль BERT нароўні з паслядоўнымі зменамі ў часе аўтарамі інтэгравана прасторавае вымярэнне. Прасторавая структура аптычнага прадстаўлення экасістэм у даных дыстанцыйнага зандзіравання нясе важную экалагічную інфармацыю і не можа быць цалкам выведзена з часовай і спектральнай восяў. Сама па сабе яна дазваляе вырашаць мноства складаных задач. Гіпотэзай гэтага даследавання з’явілася здагадка, што глыбокая нейронная сетка, навучаная на выяўленне заканамернасцяў прасторава-спектральна-часовай структуры экасістэм, павінна ўтрымліваць у вектарах схаванага стану інфармацыю пра параметры стану гэтых экасістэм, што дазваляе атрымліваць ацэнку іх значэнняў.

Матэрыялы і метады

Даследаванні заснаваныя на выніках абследавання 1033 пробных пляцовак, закладзеных у хваёвых насаджэннях на тэрыторыях з высокім узроўнем радыеактыўнага забруджвання. На пляцоўках вызначана шчыльнасць забруджвання глебы 137Cs і ўдзельная актыўнасць дадзенага радыенукліду ў неакоранай дзелавой драўніне хвоі. На падставе гэтых значэнняў вызначаны каэфіцыенты пераходу радыенукліду з глебы ў неакоранай драўніны, якія ўяўляюць сабой стаўленне яго ўдзельнай актыўнасці ў драўніне да шчыльнасці забруджвання глебы.

Шчыльнасць забруджвання 137Cs абследаваных участкаў лясных насаджэнняў складала ад 33 да 10496 кБк/м² з сярэднім значэннем 559 кБк/м² і міжкварцільным інтэрвалам 179–596 кБк/м². пры гэтым утрыманне 137Cs ў неакоранай драўніне складала ад 18 да 34214 Бк/кг з сярэднім значэннем 1120 Бк/кг і міжкварцільным інтэрвалам 208–923 Бк/кг. Дапушчальнаму ўзроўню ўтрымання 137Cs 740 Бк/кг (лесаматэрыялы круглыя для будаўніцтва сцен жылых будынкаў) адпавядае драўніна на 68,4% абследаваных участках, дапушчальнаму ўзроўню 1480 Бк/кг (лесаматэрыялы круглыя іншыя) – на 86,7% абследаваных участках.

Вынікі абследавання сведчаць аб шырокім вар’іраванні каэфіцыента пераходу 137Cs з глебы ў неакораную драўніну хвоі – ад 0,07 до 19,01 ×10P-3P м2·кг-1 з сярэднім значэннем 2,19 ×10-3 м2·кг-1 і медыянай 1,63 ×10P-3P м2·кг-1.

Мадэль RS-BERT

Аўтарамі распрацавана адзіная (end-to-end) архітэктура глыбокай нейроннай сеткі з некалькімі рэжымамі навучання: пераднавучання выключна на даных дыстанцыйнага зандзіравання Зямлі (мультыспектральных здымках Sentinel-2) і данавучання на даных дыстанцыйнага зандзіравання Зямлі, размечаных на падставе наземных назіранняў у канкрэтных участках лясных экасістэм. Назва дадзенай глыбокай нейроннай сеткі RS-BERT адлюстроўвае той факт, што яна пабудавана на аснове архітэктуры BERT і прызначана для вырашэння задач апрацоўкі даных дыстанцыйнага зандзіравання Зямлі (Remote Sensing BERT).

Уласна мадэль RS-BERT складаецца з чатырох асноўных кампанентаў:

1) кадавальніка, які перакладае мультыспектральные даныя і пазнаку часу ў вектар унутранага стану аб’екта з памерам (r);

2) некалькіх слаёў стандартных трансформераў, якія прадстаўляюць ядро архітэктуры нейроннай сеткі;

3) дэкодэра для фарміравання мультыспектральнага прадстаўлення з вектара схаванага стану (выкарыстоўваецца пры навучанні без настаўніка);

4) дэкодэра для праекцыі на вось параметру стану экасістэмы з вектара схаванага стану (выкарыстоўваецца пры данавучанні мадэлі).

У выпрабаванай рэалізацыі мадэлі прасторавы памер фрагмента мультыспектральных даных Sentinel-2 на ўваходзе складае 320×320 м, што адпавядае ўваходным матрыцам памерам 4×32×32 для чатырох каналаў з прасторавым дазволам 10 м і 6×16×16 для шасці каналаў з прасторавым дазволам 20 м.

Зыходны вектар праходзіць праз шэсць слаёў трансформераў, у якіх ажыццяўляецца ўзаемадзеянне паміж прамежкавымі вектарамі схаванага прадстаўлення дадзенага ўчастка ў іншыя моманты часу. На выхадзе апошняга трансформера фарміруецца r-мерны вектар схаванага стану аб’екта (эмбедынг), у якім заключаецца найбольш важная спектральна-прасторава-часовая інфармацыя пра яго. Такім чынам, першыя два кампаненты RS-BERT выступаюць у ролі рэпрэзентатыўнай мадэлі. Трэці і чацвёрты кампаненты дазваляюць дэкадаваць прадстаўленне аб’екта з эмбедынга ў мэтавыя характарыстыкі.

Трансформер пабудаваны па класічнай схеме. Кожны яго блок складаецца з двух асноўных кампанентаў: множнай увагі (multy-head attention) і двухслаёвага персэптрона (малюнак). Акрамя таго, кожны кампанент забяспечаны замыкальнай сувяззю і папластовай нармалізацыяй. Множная ўвага складаецца з H паралельных элементаў увагі, пабудаваных на маштабуемым вектарным памнажэнні. Кожны з гэтых элементаў увагі называецца галоўкай (head).

Схема блока трансформера, які складаецца ў кожным пласце з блока мультыўвагі (MultiHead Attention),

двухслаёвага персэптрона (Feed Forward) і двух блокаў нармалізацыі і складання (Add & Normalize).

Унутры блока маюцца дзве замыкальныя сувязі

На выхадзе апошняга пласта трансформера фармуюцца вектары схаванага стану для кожнага моманту часу. У якасці вектара схаванага стану экасістэмы выкарыстоўваецца эмбедынг для зададзенага моманту часу.

Дэкодэр у мультыспектральнае ўяўленне аб’екта пераўтварае вектар схаванага стану ў каналы мультыспектральнага здымка. Ён выкарыстоўваецца для навучання RS-BERT без настаўніка. З улікам здагадкі, што для прагнозу стану прасторавага фрагмента экасістэмы важная інфармацыя не толькі аб гэтым фрагменце, але і аб яго асяроддзі, прасторавы памер мультыспектральнага здымка выхаду (40×40 м) менш памеру на ўваходзе (320×320 м).

Фарміраванне мультыспектральнага здымка ажыццяўляецца з дапамогай двух слаёў транспаніраванай скруткі са скруткам з адзінкавым памерам фільтра паміж імі для прывядзення колькасці каналаў на выхадзе мадэлі да колькасці каналаў у мультыспектральным здымку. Прасторавы дазвол усіх каналаў на выхадзе складае 10 м. Для разліку сярэднеквадратовай памылкі з рэальнымі данымі каналы з больш грубым прасторавым дазволам праходзяць праз агрэгацыі асерадненнем. Функцыяй страт для навучання мадэлі без настаўніка з’яўляецца сярэднеквадратовая памылка паміж назіранымі і прадказанымі данымі. Навучанне без настаўніка вырабляецца з дапамогай рашэння мадэллю задачы аднаўлення мультыспектральнага прадстаўлення зададзенага ўчастка на падставе серыі папярэдніх па часе (у маштабе некалькіх гадоў) мультыспектральных уяўленняў дадзенага ўчастка. Такім чынам на этапе пераднавучання вырашаецца задача рэгрэсіі з наборам выходных значэнняў. Прагназуемае мультыспектральнае ўяўленне ўчастка фармуецца элементам глыбокай нейроннай сеткі – мультыспектральным дэкодэрам. На ўваход мультыспектральнага дэкодэра падаецца вектар схаванага прадстаўлення ўчастка лясной экасістэмы ў зададзены момант часу. Па нашай гіпотэзе, у вектары схаванага стану закадавана не толькі мультыспектральнае ўяўленне ўчастка, але і параметры стану экасістэмы. Выманне гэтых параметраў стану, уключаючы каэфіцыенты пераходу радыенуклідаў, з вектара схаванага стану можа быць выраблена з дапамогай адпаведных дэкодараў, якія з’яўляюцца пластамі нейроннай сеткі, данавучанымі пасля на размечаных даных.

Дэкодэр параметраў стану экасістэмы выкарыстоўваецца для атрымання мэтавага параметру стану. У дадзенай працы на выхадзе дэкодэра параметру стану – каэфіцыент пераходу 137Cs з глебы ў неакораную драўніну хвоі. Дадзены кампанент складаецца з двухслаёвага персэптрона з функцыяй актывацыі ReLU паміж імі. На ўваход дэкодэра падаецца вектар схаванага стану апошняга элемента ў паслядоўнасці, генераванага мадэллю для зададзенага часу.

Для навучання мадэлі на абодвух этапах выкарыстаны алгарытм Adam з базавай хуткасцю навучання 0,0001. У схему навучання дададзены этап разагрэву на працягу 30 эпох і наступнае экспанентнае памяншэнне тэмпу навучання. Для павышэння ўзроўню абагульнення мадэлі прынята рашэнне аб уключэнні дропаўта ў блокі слаёў трансформераў. Узровень дропаўта складае 0,1. Данавучанне на размечаных даных ажыццяўляецца на працягу 200 эпох. Памер пакета як на этапе пераднавучання, так і пры данавучанні складае 64. Пры данавучэнні мадэлі параметры энкодэра і слаёў трансформера замарожваюцца (застаюцца нязменнымі).

Даныя для папярэдняга навучання мадэлі ўяўляюць сабой элементы мультыспектральных здымкаў Sentinel-2 (Level-2a), адабраныя ў выпадковых геаграфічных пазіцыях у межах лясных насаджэнняў на тэрыторыі Палескага дзяржаўнага радыяцыйна-экалагічнага запаведніка. Для кожнай з пазіцый маецца не менш за 16 здымкаў, атрыманых на працягу вегетацыйных перыядаў 2017 і 2018 гадоў. У набор уключаны здымкі, якія захапляюць перыяд часу ад пачатку да заканчэння вегетацыйнага перыяду. У тым выпадку, калі геаграфічная пазіцыя зачынена аблокамі, здымак выключаўся з набору.

Данавучанне глыбокай нейроннай сеткі RS-BERT для вызначэння каэфіцыента пераходу 137Cs з глебы ў неакораную драўніну хвоі ажыццяўлялася на трэніровачнай выбарцы, якая складае 60% ад набору даных, сабраных на пробных пляцоўках. Аўгментацыя даных ажыццяўлялася з дапамогай адбору фрагментаў здымкаў Sentinel-2 з цэнтрамі на адлегласці адзін ад аднаго 10 м па шыраце і даўгаце і засяроджаных у 40 м вакол цэнтра пункта правядзення палявых даследаванняў. Акрамя таго, 15 здымкаў для падачы на ўваход мадэлі адбіраліся рандамізавана з поўнага набору даных, аб’ём якога для кожнай пазіцыі складаў да 50 здымкаў. Вектар схаванага стану апошняга здымка ў паслядоўнасці мадэляваўся на дату 15.11.2018 і выкарыстоўваўся для падачы ў дэкодэр каэфіцыента пераходу.

Вынікі і абмеркаванне

Звычайна прагноз забруджвання драўніны тэхнагеннымі радыенуклідамі (137Cs, ⁹⁰Sr) ажыццяўляецца на аснове тыпалагічнай прыналежнасці насаджэнні (ТЛ) і тыпу лесараслінных умоў па Вараб’ёву-Паграбняку (ТЛУ). Перавагамі такога падыходу з’яўляюцца яго прастата і адсутнасць неабходнасці ў правядзенні дадатковых аналізаў. Ён выкарыстаны ў якасці базавай мадэлі параўнання. Прымяненне сярэднеарыфметычных значэнняў каэфіцыента пераходу 137Cs з глебы ў неакораную драўніну хвоі з разбіўкай па тыпах лесу дазваляе зрабіць прагноз каэфіцыента пераходу з даволі высокім значэннем сярэднеквадратычнага адхілення (СКА) – 3,951 (табліца). Пры выкарыстанні ў якасці параметру мадэлі тыпу ўмоў вырастання (ТУВ) СКА некалькі вышэй. Камбінацыя ТЛ і ТУВ у адной мадэлі практычна не змяніла СКА адносна мадэлі, заснаванай толькі на ТЛ.

Паказчыкі дакладнасці выпрабаваных эмпірычных мадэляў прагнозу назапашвання 137Cs у неакоранай драўніне хвоі

Такім чынам, выкарыстанне для прагнозу каэфіцыента пераходу 137Cs у неакораную драўніну хвоі пакідае высокую ступень нявызначанасці выніку. Таму пошук альтэрнатыўных падыходаў да вырашэння гэтай задачы з’яўляецца актуальным.

Ацэнка адэкватнасці навучанай мадэлі RS-BERT на тэставай выбарцы паказала, што СКА для каэфіцыента пераходу 137Cs з глебы ў неакораную драўніну складае 2,397. Гэта з’яўляецца лепшым вынікам сярод выпрабаваных метадаў. Дадзеная мадэль дазваляе атрымаць найбольш надзейны прагноз адпаведнасці драўніны РДУ/ЛХ-2001 па такіх метрыках, як F-мера, дакладнасць і паўната.

Варта адзначыць, што перавагай выкарыстання даных дыстанцыйнага зандзіравання Зямлі для прагнозу параметраў назапашвання радыенуклідаў ляснымі насаджэннямі з’яўляецца не толькі больш высокая дакладнасць, але і адсутнасць неабходнасці ў наземным абследаванні экасістэм і даных лесаўпарадкавання. Гэты факт актуальны для лясных зямель на тэрыторыях з высокімі ўзроўнямі радыеактыўнага забруджвання, дзе не вядзецца гаспадарчая дзейнасць, а знаходжанне чалавека абмежавана зыходзячы з патрабаванняў радыяцыйнай бяспекі.

Аналіз магчымасці выкарыстання часовых серый мультыспектральных спадарожнікавых здымкаў для прагнозу параметраў пераходу 137Cs ў драўніну праведзены толькі для абмежаванай тэрыторыі – Палескага дзяржаўнага радыяцыйна-экалагічнага запаведніка, этапу аддаленых радыеэкалагічных наступстваў выкіду радыенуклідаў у навакольнае асяроддзе і адной пароды – хвоі. Для больш абгрунтаваных высноў неабходна пашырыць геаграфію даследавання і пералік лясных парод. Наступным крокам можа стаць увядзенне ў мадэль фактару часу пасля радыеактыўных выпадзенняў.

Разам з тым атрыманы вынік, які пацвярджае здагадку аб магчымасці пабудовы мадэлі прагнозу каэфіцыента пераходу 137Cs у драўніну хвоі на падставе толькі мультыспектральных спадарожнікавых здымкаў з апрацоўкай у глыбокай нейроннай сеткі. Пры гэтым дакладнасць атрыманага прагнозу аказваецца вышэй прагнозу на падставе лесатыпалагічных прыкмет.

Ранейшае даследаванне Раней Наступнае даследаванне Далей