Мы выкарыстоўваем файлы cookie на гэтым сайце для паляпшэння вашага вопыту карыстання.
Для больш падрабязнай інфармацыі азнаёмцеся з Палітыка канфідэнцыяльнасці

Інтэлектуальная сістэма падтрымкі прыняцця рашэнняў у галіне касмічнай дзейнасці
І. М. Бойко, Д. С. Пісарэўскі, А. А. Мацко

Уводзіны

У цяперашні час крыніцай інфармацыі, якую выкарыстоўваюць больш, з’яўляецца Інтэрнэт. Знойдзеная інфармацыя дазваляе не толькі атрымліваць адказы на канкрэтныя запыты, але і адсочваць тэндэнцыі тэхналагічнага развіцця ў розных прыкладных абласцях. У дадзеным артыкуле паняцце “тэндэнцыя” фармулюецца як асноўны напрамак, якое вызначае развіццё чаго б там ні было ў разглядаемай вобласці дзейнасці. Важна не проста выяўляць тэндэнцыі, але і старанна іх фільтраваць, а таксама разумець прычыны і следства развіцця тэхналогій, таму што колькасць новых тэхналогій вылічаецца тысячамі. Калі своечасова заўважыць, што нейкае новаўвядзенне ў хуткім часе можа стаць прарыўным, то, магчыма, варта сканцэнтравацца на вывучэнні тэхналогіі развіцця гэтых новаўводзін. Вызначана, інтэлектуальныя сістэмы збору, захоўвання і апрацоўкі інфармацыі, дапоўненыя функцыяй аналізу для выяўлення тэхналагічных тэндэнцый, па-першае, спатрэбяцца любому аналітыку і стратэгу ў яго бягучай працы і, па-другое, акажуць падтрымку асобам, якія прымаюць рашэнні. У цяперашні час інфармацыйна-аналітычная інтэлектуальная сістэма (ІАІС), якая рэалізуе ўсе гэтыя функцыі, распрацоўваецца ва УП «Геаінфармацыйныя сістэмы».

Тэхналогіі апрацоўкі інфармацыі для выяўлення тэндэнцый

На мал. 1 паказаны асноўныя тэхналогіі, якія прымяняюцца пры распрацоўцы ІАІС. Спачатку збіраюцца даныя, якія праходзяць лінгвістычны аналіз і структурызацыю. Пасля гэтага ў аўтаматызаваным рэжыме будуецца анталогія сутнасцяў, якая з’яўляецца семантычным ядром сістэмы і, па сутнасці, якая служыць базай ведаў (БЗ) зададзенай прадметнай вобласці. Пры гэтым сутнасці могуць быць як аднаслоўнымі, так і складаюцца з некалькіх слоў, напрыклад: апарат, касмічны апарат, Беларускі касмічны апарат. Паміж сутнасцямі задаюцца сэнсавыя адносіны. На мал. 2 паказаны прыклад анталогіі, пабудаванай з дапамогай рэдактара анталогіі Protégé.

Пры пошуку па запыце інфармацыі ў БЗ адбываецца лінгвістычны аналіз запыту, пасля чаго не толькі ажыццяўляецца пошук выдзеленых сутнасцяў у БЗ, але і разглядаюцца адносіны паміж імі.

Мал. 1. Тэхналогіі апрацоўкі інфармацыі для выяўлення тэндэнцый

Кожная сутнасць у БЗ атрымлівае сваю разліковую вагу і звязана з наборам тэкстаў, з якіх яна была вынятая. Кожнае сэнсавае стаўленне таксама атрымлівае сваю вагу ў залежнасці ад агульнай частотнасці яго выкарыстання рознымі сутнасцямі. Наяўнасць вагі сутнасцяў і іх адносін дазваляе разлічыць вагі цэлых галін або падгалін сутнасцяў у анталогіі. Менавіта гэтыя вагі і з’яўляюцца асновай для аналітыкі выяўлення тэндэнцый з выкарыстаннем метадаў статыстыкі і метадаў машыннага навучання.

Варта падкрэсліць, што паколькі ў сістэму бесперапынна паступаюць новыя тэксты, то пасля іх лінгвістычнай апрацоўкі вагі сутнасцяў пералічваюцца. Перыядычнасць пераліку залежыць ад колькасці паступленняў новых тэкстаў.

Мал. 2. Анталогія – семантычнае ядро

 

Паток апрацоўкі інфармацыі для выяўлення тэндэнцый

На мал. 3 паказана паслядоўнасць выяўлення тэндэнцый.

Мал. 3. Паток апрацоўкі інфармацыі для выяўлення тэндэнцый

 

Пры распрацоўцы сістэмы на першым этапе апрацоўваліся тэксты, якія як правіла змяшчаюць інфармацыю, якая ўжо мае некаторы тэрмін даўнасці, паколькі публікацыя ажыццяўляецца пасля іх доўгага часу назапашвання выдавецтвам і рэцэнзавання, напрыклад: тэзісы навуковых канферэнцый, навуковыя артыкулы ў часопісах, патэнты, профільныя стандарты і інш. Затым ажыццяўляўся этап збору інфармацыі з навінавых вэб-крыніц, як RSS-каналаў, так і стандартных навінавых інтэрнэт-старонак.

Пасля лінгвістычнай апрацоўкі, якая ўключае ў сябе вызначэнне сутнасцяў-аналагаў і сінонімаў, усе выдзеленыя сутнасці размяшчаюцца ў галінках анталогіі, для іх разлічваюцца вагі і ўсталёўваюцца паказальнікі на тэкставыя крыніцы, якія захоўваюцца ў БЗ.

Зараз па патрабаванні карыстальніка, які вызначае перыяд і тып публікацый, напрыклад: з 2020 па 2023 г. толькі часопісы і навіны, адбываецца вылічэнне вагаў, якія захоўваюцца ў анталогіі сутнасцяў, вызначаючых тэндэнцыі.

Канчатковае рашэнне, на якія тэндэнцыі звярнуць увагу, прымае эксперт або асоба, якая прымае гэтае рашэнне.

 

Перспектывы развіцця сістэмы

Перспектыўным уяўляецца выкарыстанне ўніверсальнага семантычнага кода (УСК). УСК з’яўляецца мадэллю семантычнага прадстаўлення ведаў і задае аксіёмы вываду адных ведаў з іншых. З дапамогай УСК можна вывесці паслядоўнасці выканання дзеянняў у трыядах суб’ект-дзеянне-аб’ект. Паслядоўнасці такіх трыяд не з’яўляюцца адвольнымі і вылічаюцца з дапамогай набору семантычных аксіём. Мяркуецца, што, вылічаючы вагі такіх паслядоўнасцяў, можна будзе выяўляць не толькі некаторыя тэндэнцыі, але і іх паслядоўную эвалюцыю.

Падыход з выкарыстаннем УСК у дадзены момант знаходзіцца ў стадыі даследавання і патрабуе глыбокай практычнай прапрацоўкі.

Заключэнне

Па сутнасці, ІАІС – гэта платформа для разліку колькасных ацэнак тэндэнцый у зададзенай прадметнай вобласці на рэгулярнай аснове, за паўгода, за год ці нават за месяц, паколькі навінавая інфармацыя паступае штодня з мноства інтэрнэт-крыніц.

Як правіла, у сярэдніх і вялікіх кампаніях пошукамі прарыўных тэхналогій займаецца падраздзяленне стратэгічных ініцыятыў, даследуе профільную прадметную вобласць. У выніку маніторынгу тэндэнцый вызначаецца спіс тэхналогій, якія кампанія можа пачаць развіваць у бліжэйшы час.

З павелічэннем колькасці аналізаванай інфармацыі дадаюцца новыя характарыстыкі, якія ўплываюць на вагі ў крыніцы, і пашыраюцца спісы крыніц інфармацыі. Пры гэтым паляпшаецца якасць мадэляў і алгарытмаў, каб мінімізаваць памылкі класіфікацыі і кластарызацыі.