Головна · Болі у шлунку · Застосування штучних нейронних мереж у медицині. Нейросети діагностують проблеми із серцем точніше, ніж лікарі. Нестандартні застосування нейронних мереж

Застосування штучних нейронних мереж у медицині. Нейросети діагностують проблеми із серцем точніше, ніж лікарі. Нестандартні застосування нейронних мереж

Нейронні мережі у медицині

Гострий біль у грудях. Швидка допомога доставляє хворого до приймального спокою, де черговий лікар повинен поставити діагноз і визначити, чи це справді інфаркт міокарда. Досвід показує, що частка пацієнтів, які перенесли інфаркт серед надійшли з аналогічними симптомами, невелика. Точних методів діагностики, проте, досі немає. Електрокардіограма іноді не містить явних ознак недуги. А скільки всього параметрів стану хворого можуть так чи інакше допомогти поставити в даному випадку правильний діагноз? Понад сорок. Чи може лікар у приймальному спокої швидко проаналізувати всі ці показники разом із взаємозв'язками, щоб ухвалити рішення про направлення хворого до кардіологічного відділення? Якоюсь мірою це завдання допомагають вирішувати нейромережеві технології.

Статистика така: лікар правильно діагностує інфаркт міокарда у 88% хворих та помилково ставить цей діагноз у 29% випадків. Хибних тривог (гіпердіагностики) надто багато. Історія застосування різних методів обробки даних для підвищення якості діагностики налічує десятиліття, проте найкращий з них допоміг скоротити кількість випадків гіпердіагностики лише на 3%.

В 1990 Вільям Бакст з Каліфорнійського університету в Сан-Дієго використовував нейронну мережу - багатошаровий персептрон - для розпізнавання інфаркту міокарда у пацієнтів, що поступають у прийомний спокій з гострим болем в грудях. Його метою було створення інструменту, здатного допомогти лікарям, які не в змозі впоратися з потоком даних, що характеризують стан хворого, що надійшов. Іншою метою можливо вдосконалення діагностики. Своє завдання дослідник ускладнив, оскільки аналізував дані лише тих пацієнтів, кого вже направили до кардіологічного відділення. Бакст використав лише 20 параметрів, серед яких були вік, стать, локалізація болю, реакція на нітрогліцерин, нудота і блювання, потіння, непритомність, частота дихання, прискореність серцебиття, попередні інфаркти, діабет, гіпертонія, здуття шийної вени, ряд особливостей значних ішемічних змін.

Мережа продемонструвала точність 92% при виявленні інфаркту міокарда та дала лише 4% випадків сигналів помилкової тривоги, помилково підтверджуючи направлення пацієнтів без інфаркту до кардіологічного відділення. Отже, очевидним є факт успішного застосування штучних нейронних мереж у діагностиці захворювання. Тепер необхідно пояснити, у яких параметрах оцінюється якість діагнозу у випадку. Припустимо, що з десяти осіб, які мають інфаркт дійсно є, діагностичний метод дозволяє виявити захворювання у восьми. Тоді чутливість методу становитиме 80%. Якщо ж ми візьмемо десять осіб, які не мають інфаркту, а метод діагностики запідозрить його у трьох осіб, то частка помилкових тривог складе 30%, при цьому додаткова до нього характеристика - специфічність методу - дорівнюватиме 70%.


Ідеальний метод діагностики повинен мати стовідсоткову чутливість і специфічність - по-перше, не пропускати жодної дійсно хворої людини і, по-друге, не лякати здорових людей. Щоб застрахуватися, можна і потрібно намагатися передусім забезпечити стовідсоткову чутливість методу – не можна пропускати захворювання. Але в це обертається, як правило, низькою специфічністю методу – у багатьох людей лікарі підозрюють захворювання, на які насправді пацієнти не страждають.

Нейронні мережі для задач діагностики

Нейронні мережі є нелінійними системами, що дозволяють набагато краще класифікувати дані, ніж зазвичай використовувані лінійні методи. У додатку до медичної діагностики вони дозволяють значно підвищити специфічність методу, не знижуючи його чутливості.

Згадаймо, що нейронна мережа, що діагностує інфаркт, працювала з великим набором параметрів, вплив яких на встановлення діагнозу людині неможливо оцінити. Проте нейромережі виявилися здатними приймати рішення, ґрунтуючись на прихованих закономірностях, що виявляються ними, в багатовимірних даних. Відмінна властивість нейромереж полягає в тому, що вони не програмуються - не використовують жодних правил виведення для встановлення діагнозу, а навчаються робити це на прикладах. У цьому сенсі нейромережі зовсім не схожі на експертні системи, розробка яких у 70-ті роки відбувалася після тимчасової "перемоги" Штучного Інтелекту над тим підходом до моделювання пам'яті, розпізнавання образів та узагальнення, що ґрунтувався на вивченні нейронної організації мозку.

Однією з найвідоміших із розроблених експертних систем, дія яких ґрунтувалася на знаннях, витягнутих у експертів, та на реалізації процедур виведення, була система MYCIN. Цю систему розробили у Стенфорді на початку 70-х років для діагностики септичного шоку. Половина хворих помирала від нього протягом доби, а лікарі могли виявляти сепсис лише у 50% випадків. MYCIN, здавалося, була справжнім тріумфом технології експертних систем – адже вона дозволяла виявити сепсис у 100% випадків. Однак після більш уважного знайомства з цією експертною системою лікарі значно вдосконалили традиційні методи діагностики, і MYCIN втратив своє значення, перетворившись на навчальну систему. Експертні системи "пішли" лише в кардіології – для аналізу електрокардіограм. Складні правила, які становлять головний зміст книг щодо клінічного аналізу ЕКГ, використовувалися відповідними системами для видачі діагностичного висновку.

Діагностика є окремим випадком класифікації подій, причому найбільшу цінність представляє класифікація тих подій, які відсутні в навчальному нейромережі наборі. Тут проявляється перевага нейромережевих технологій – вони здатні здійснювати таку класифікацію, узагальнюючи колишній досвід та застосовуючи його у нових випадках.

Конкретні системи

Прикладом програми діагностики є пакет кардіодіагностики, розроблений фірмою RES Informatica спільно з Центром кардіологічних досліджень у Мілані. Програма дозволяє здійснювати неінвазивну кардіодіагностику на основі розпізнавання спектрів тахограм. Тахограма є гістограмою інтервалів між послідовними серцебиттями, і її спектр відображає баланс активностей симпатичної і парасимпатичної нервової системи людини, що специфічно змінюється при різних захворюваннях.

Так чи інакше, вже зараз можна констатувати, що нейронні мережі перетворюються на інструмент кардіодіагностики – в Англії, наприклад, вони використовуються у чотирьох шпиталях для попередження інфаркту міокарда.

У медицині знаходить застосування й інша особливість нейромереж - їхня здатність передбачати тимчасові послідовності. Вже зазначалося, що експертні системи досягли успіху в аналізі ЕКГ. Нейросети тут теж приносять користь. Кі Чженху, Ю Хену і Вілліс Томпкінс з університету штату Вісконсін розробили нейромережеву систему фільтрації електрокардіограм, що дозволяє придушувати нелінійний і нестаціонарний шум значно краще, ніж методи, що раніше використовувалися. Справа в тому, що нейромережа добре пророкувала шум за його значеннями в попередні моменти часу. А те, що нейромережі дуже ефективні для передбачення тимчасових послідовностей (таких, наприклад, як курс валют або котирування акцій), переконливо продемонстрували результати змагання передбачуваних програм, що проводяться університетом у Санта Фе – нейромережі посіли перше місце та домінували серед найкращих методів.

Можливості застосування нейромереж

ЕКГ - це приватна, хоча і виключно важлива програма. Однак сьогодні існує багато інших прикладів використання нейромереж для медичних прогнозів. Відомо, що довгі черги до кардіохірургічних відділень (від тижнів до місяців) викликані нестачею реанімаційних палат. Збільшити їхнє число не вдається через високу вартість реанімаційної допомоги (70% коштів американці витрачають в останні 2 тижні життя саме в цьому відділенні).

Вихід лише у більш ефективному використанні наявних коштів. Припустимо, що стан прооперованих у день хворих настільки важкий, що їм необхідне їх тривале перебування у реанімаційної палаті (понад дві доби). Весь цей час хірурги простоюватимуть, оскільки новопрооперованих хворих нікуди класти. Тяжких хворих розумніше оперувати перед вихідними чи святами - операційні все одно закриті в ці дні, хірурги відпочиватимуть, а хворі відновлюватимуться у реанімації. А ось на початку робочого тижня краще прооперувати тих пацієнтів, яким потрібно перебувати в реанімаційній палаті лише один-два дні. Тоді ліжка в реанімації звільнятимуться швидше та прийматимуть нових, прооперованих у вівторок та середу хворих.

Питання, як вгадати, кому доведеться надовго затриматися в блоці інтенсивної терапії після операції, а кому - ні. Джек Ту і Майкл Гуерір зі шпиталю Святого Михайла університету в Торонто використовували нейронні мережі для такого передбачення. Як вихідні дані вони взяли ті відомості про пацієнта, які відомі в передопераційний період. Зауважимо, що у попередніх роботах, які не використовують нейронні мережі, як фактори підвищеного ризику перебування в реанімації застосовувалися також важливі післяопераційні відомості - різні ускладнення, що виникли в ході хірургічного втручання.

Ту і Гуерир навчили двошаровий персептрон розділяти хворих на три групи ризику, враховуючи їх вік, стать, функціональний стан лівого шлуночка, ступінь складності майбутньої операції та наявність супутніх захворювань. З тих пацієнтів, яких мережа віднесла до групи малого ризику затримки у реанімації, лише 16,3% справді провели у ній понад два дні. Водночас понад 60% тих, кого мережа віднесла до групи підвищеного ризику, виправдали несприятливий прогноз.

Боротьба з раком

Ми приділяли особливу увагу серцево-судинним захворюванням, оскільки саме вони утримують сумне лідерство у списку причин смертності. На другому місці знаходяться онкологічні захворювання. Один із головних напрямів, у якому зараз йдуть роботи з використання нейронних мереж, – діагностика раку молочної залози. Ця недуга - причина смерті кожної дев'ятої жінки.

Виявлення пухлини здійснюється під час первинного рентгенографічного аналізу молочної залози (мамографії) та подальшого аналізу шматочка тканини новоутворення (біопсії). Незважаючи на існування загальних правил диференціювання доброякісних та злоякісних новоутворень, за даними мамографії, лише від 10 до 20% результатів наступної хірургічної біопсії справді підтверджують наявність раку молочної залози. Знову маємо справу з випадком вкрай низької специфічності методу.

Дослідники з університету Дьюка навчили нейронну мережу розпізнавати маммограми злоякісної тканини на основі восьми особливостей, з якими зазвичай мають справу радіологи. Виявилося, що мережа здатна вирішувати поставлене завдання з чутливістю близько 100% та специфічністю 59% (порівняйте з 10-20% у радіологів). Скільки жінок з доброякісними пухлинами можна не наражати на стрес, пов'язаний з проведенням біопсії, якщо використовувати цю нейронну мережу! У клініці Майо (Міннесота) нейромережа аналізувала результати ультразвукового дослідження молочної залози та забезпечила специфічність 40%, тоді як для тих самих жінок специфічність укладання радіологів виявилася нульовою. Чи не правда, успіх використання нейромережевих технологій виглядає зовсім не випадковим?

Після лікування раку молочної залози можливі рецидиви пухлини. Нейросети вже допомагають ефективно їх пророкувати. Подібні дослідження проводяться на медичному факультеті Техаського університету. Навчені мережі показали свої здібності виявляти та враховувати дуже складні зв'язки прогностичних змінних, зокрема, їх потрійні зв'язки для поліпшення передбачуваної спроможності.

Різноманітні можливості застосування нейромереж у медицині, і різноманітна їхня архітектура. На основі прогнозу віддалених результатів лікування захворювання тим чи іншим методом можна віддати перевагу одному з них. Значного результату в прогнозі лікування раку яєчника (хвороба кожної сімдесятої жінки) досяг відомий голландський фахівець Герберт Каппен з університету в Німегені (він використовує у своїй роботі не багатошарові персептрони, а так звані Машини Больцмана - нейромережі для оцінки ймовірностей).

А ось приклад іншого онкологічного захворювання. Дослідники з медичної школи в Кагаві (Японія) навчили нейромережу, яка практично безпомилково прогнозувала за передопераційними даними результати резекції печінки у хворих на печінково-клітинну карциному.

У Троїцькому інституті інноваційних та термоядерних досліджень (ТРІНІТІ) в рамках проекту створення нейромережевих консультаційних систем, що реалізується Міністерством науки, була розроблена нейромережева програма, яка обирає метод лікування базальноклітинного раку шкіри (базаліоми) на основі довгострокового прогнозу розвитку рецидиву. Число захворювань на базаліому - онкологічною недугою білошкірих людей з тонкою шкірою - становить третину всіх онкологічних захворювань.

Діагностика однієї з форм меланоми - пухлини, яку іноді непросто відрізнити від пігментної форми базаліоми, була реалізована за допомогою нейромережевого симулятора Multineuron, розробленого у ВЦ СОАН у Красноярську під керівництвом О.М.Горбаня.

Нейросети можна використовувати і для прогнозу дії різних засобів лікування, що розробляються. Вони вже успішно застосовуються в хімії для прогнозу властивостей сполук на основі їхньої молекулярної структури. Дослідники з Національного інституту раку США використовували нейромережі для передбачення механізму дії препаратів, що застосовуються при хіміотерапії злоякісних пухлин. Зауважимо, що існують мільйони різних молекул, які необхідно досліджувати щодо їх антиракової активності. Фахівці Інституту раку розбили відомі онкологічні препарати на шість груп відповідно до механізму їхньої дії на ракові клітини та навчили багатошарові мережі класифікувати нові речовини та розпізнавати їхню дію. Як вихідні дані використовувалися результати експериментів з придушення росту клітин з різних пухлин. Нейромережна класифікація дозволяє визначити, які із сотень щоденно апробованих молекул варто вивчати далі у досить дорогих експериментах in vitro та in vivo. Для вирішення аналогічного завдання використовувалися мережі Кохонена. Ці учні без вчителя самоорганізуються нейромережі розбивали речовини на заздалегідь невідоме число кластерів і тому дали дослідникам можливість ідентифікувати речовини, що мають нові цитотоксичні механізми впливу.

Нейросистеми, генетика та молекули

Діагностика та лікування онкологічних захворювань, а також розробка нових медикаментозних засобів безсумнівно є найважливішою сферою застосування нейромережевих технологій. Проте останнім часом серед дослідників та лікарів зростає усвідомлення того факту, що майбутні успіхи мають бути тісно пов'язані з вивченням молекулярних та генетичних причин розвитку захворювань.

Не випадково у квітні 1997 року експерти Національного інституту здоров'я (США) виступили з рекомендаціями щодо посилення досліджень, пов'язаних з виявленням причин, що викликають рак, та розробок, спрямованих на попередження хвороб. Нейросети вже давно активно застосовуються в аналізі геномних послідовностей ДНК, зокрема для розпізнавання промоторів - ділянок, що передують генам і зв'язуються з білком РНК-полімеразу, який ініціює транскрипцію. Їх використовують для диференціації кодуючих та некодуючих ділянок ДНК (екзонів та інтронів) та передбачення структури білків.

У 1996 році було зроблено сенсаційне відкриття, що пов'язало фундаментальні дослідження в молекулярній генетиці з проблемою патогенезу та лікування найпоширенішого онкологічного захворювання – базальноклітинного раку шкіри. Дослідники виявили в дев'ятій хромосомі людини ген (PTC), мутації в якому, на відміну від p53 гена, викликані впливом ультрафіолету і є причиною розвитку пухлини. Ключем до відкриття стало вивчення так званого латочного гена, зміни в якому стимулювали дефекти розвитку плодової мушки і той факт, що у дітей, які також страждають на дефекти розвитку кісткової тканини (базальний невусний синдром), часто є множинні базаліоми.

Тепер генетики та лікарі сповнені надій знайти медикаментозний засіб лікування базаліоми або використовувати методи генної хірургії, та замінити ними такі нещадні методи лікування, як звичайна лазерна, рентгенівська та кріохірургія. Чи можуть нейронні мережі виявитися корисними для цих досліджень? Зокрема, чи не можна з їхньою допомогою оцінити можливий вплив певної мутації на зміну властивостей відповідних білків або оцінити її прогностичне значення, скажімо, для розвитку рецидиву раку молочної залози?

Якби це можна було зробити, то нейромережі значно зменшили б область пошуку для молекулярних біологів, які часто "на дотик" проводять дуже дорогі експерименти з оцінки ролі мутацій у молекулі ДНК. Нагадаємо, що до розвитку злоякісних пухлин призводить неконтрольоване зростання та поділ клітин. Геном людини, в якому записана інформація про всі білки, що виробляються в організмі, налічує близько трьох мільярдів нуклеотидів. Але тільки 2-3% з них дійсно кодують білки - решта потрібна самій ДНК для підтримки правильної структури, реплікації та іншого.

У геномних послідовностях ДНК можна приблизно виділити три складові: у першій містяться численні копії однакових фрагментів (сателітна ДНК); у другій знаходяться помірно повторювані послідовності, розсіяні по геному; а в третій _унікальна ДНК. У сателітній ДНК різні копії представлені неоднаково - їх кількість варіюється від сотень до мільйонів. Тому вони зазвичай ще поділяються на міні- та мікросателітів.

Чудово, що розподіл мікросателітів по геному настільки специфічно, що може використовуватися як аналог відбитків пальців для людини. Вважають також, що цей розподіл може бути використаний і для діагностики різних захворювань.

У прихованому вигляді повтори нуклеотидних послідовностей відіграють важливу роль і унікальні послідовності ДНК. Згідно з гіпотезою Френсіса Крика, еволюція ДНК починається від квазіперіодичних структур, і якщо ми зможемо знайти приховані повтори, то дізнаємося, де відбулися мутації, що визначили еволюцію, а отже, знайдемо і найдавніші, і найважливіші ділянки, мутації яких найбільш небезпечні. Розподіл прихованих повторів також тісно пов'язане зі структурою та функцією білків, що кодуються відповідною послідовністю.

У ТРІНІТІ була розроблена система, в якій для пошуку прихованих повторів та оцінки ролі мутацій у послідовностях ДНК використовуються модифікації нейромереж Хопфілда. Є надія, що цей підхід можна буде використовувати для узагальненого спектрального аналізу послідовностей даних загального виду, наприклад, для аналізу електрокардіограм.

Нейросети крокують планетою

Географія дослідницьких груп, що застосовують нейромережі для розробки медичних програм, дуже широка. Про США нема чого й казати - в університеті кожного штату ведуться подібні дослідження, причому головний їхній напрямок - рак молочної залози. Та що там університети – військові академії цим теж займаються. У Чехії Іржі Шима розробив теорію навчання нейронних мереж, здатних ефективно працювати з так званими інтервальними даними (коли відомі не значення параметра, а інтервал його зміни) і використовує їх у різних медичних додатках. У Китаї співробітники Інституту атомної енергії навчили нейромережу відрізняти хворих з легкими та тяжкими захворюваннями епітелію стравоходу від тих, хто страждає на рак стравоходу, на основі елементного аналізу нігтів.

У Росії в НДІЯФ МГУ нейромережі застосовуються для аналізу захворювань органів слуху.

Нарешті, в Австралії Джордж Христос використав теорію нейронних мереж для побудови першої гіпотези про причини загадкового синдрому раптової смерті новонароджених.

Замість ув'язнення

Зрозуміло, у статті наведено далеко не повний перелік прикладів використання технологій штучних нейронних мереж у медицині. Осторонь залишилася психіатрія, травматологія та інші розділи, в яких нейромережі пробуються на роль помічника діагноста та клініциста. Не все, звичайно, виглядає безхмарним у спілкі нової комп'ютерної технології та охорони здоров'я. Нейросетевые програми часом дуже дорогі для широкого впровадження в клініці (від тисяч до десятків тисяч доларів), а лікарі досить скептично ставляться до будь-яких комп'ютерних інновацій. Висновок, виданий нейронною мережею, повинен супроводжуватися прийнятними поясненнями або коментарями.

Але підстави для оптимізму таки є. Освоїти та застосовувати технології нейронних мереж значно простіше, ніж вивчати математичну статистику чи нечітку логіку. Для створення нейромережевої медичної системи потрібні не роки, а місяці. Та й параметри дуже обнадіюють – згадаємо ще раз високу специфічність діагностики.

І ще одна надія на співпрацю – саме слово "нейрон". Все-таки воно так добре знайоме медикам.

Доброго дня мене звати Наталія Єфремова, і я research scientist в компанії NtechLab. Сьогодні я розповідатиму про види нейронних мереж та їх застосування.

Спочатку скажу кілька слів про нашу компанію. Компанія нова, можливо багато хто з вас ще не знає, чим ми займаємося. Минулого року ми виграли змагання MegaFace. Це міжнародне змагання з розпізнавання осіб. Цього ж року було відкрито нашу компанію, тобто ми на ринку вже близько року, навіть трохи більше. Відповідно, ми одна з провідних компаній у розпізнаванні осіб та обробці біометричних зображень.

Перша частина моєї доповіді буде спрямована тим, хто не знайомий з нейронними мережами. Я займаюся безпосередньо deep learning. У цій галузі я працюю понад 10 років. Хоча вона з'явилася трохи менше, ніж десятиліття тому, раніше були зачатки нейронних мереж, які були схожі на систему deep learning.

В останні 10 років deep learning та комп'ютерний зір розвивалися неймовірними темпами. Все, що зроблено значущого в цій галузі, відбулося в останні 6 років.

Я розповім про практичні аспекти: де, коли, що застосовувати у плані deep learning для обробки зображень та відео, для розпізнавання образів та осіб, оскільки я працюю в компанії, яка цим займається. Трохи розповім про розпізнавання емоцій, які підходи використовуються в іграх та робототехніці. Також я розповім про нестандартне застосування deep learning, те, що тільки виходить з наукових інститутів і поки що мало застосовується на практиці, як це може застосовуватися, і чому це складно застосувати.

Доповідь складатиметься із двох частин. Так як більшість знайомі з нейронними мережами, спочатку я швидко розповім, як працюють нейронні мережі, що таке біологічні нейронні мережі, чому нам важливо знати, як це працює, що таке штучні нейронні мережі, і які архітектури в яких сферах застосовуються.

Відразу вибачаюсь, я трохи перескакуватиму на англійську термінологію, тому що більшу частину того, як називається це російською мовою, я навіть не знаю. Можливо, ви теж.

Отже, перша частина доповіді буде присвячена згортковим нейронним мережам. Я розповім, як працюють convolutional neural network (CNN), розпізнавання зображень на прикладі з розпізнавання облич. Трохи розповім про рекурентні нейронні мережі recurrent neural network (RNN) та навчання з підкріпленням на прикладі систем deep learning.

Як нестандартне застосування нейронних мереж я розповім про те, як CNN працює в медицині для розпізнавання воксельних зображень, як використовуються нейронні мережі для розпізнавання бідності в Африці.

Що таке нейронні мережі

Прототипом для створення нейронних мереж послужили, як це не дивно, біологічні нейронні мережі. Можливо, багато хто з вас знає, як програмувати нейронну мережу, але звідки вона взялася, я думаю, деякі не знають. Дві третини всієї сенсорної інформації, яка до нас потрапляє, надходить із зорових органів сприйняття. Більше однієї третини поверхні нашого мозку зайняті двома найголовнішими зоровими зонами - дорсальний зоровий шлях і вентральний зоровий шлях.

Дорсальний зоровий шлях починається в первинній зоровій зоні, в нашому тім'ячку і продовжується нагору, тоді як вентральний шлях починається на нашій потилиці і закінчується приблизно за вухами. Все важливе розпізнавання образів, яке у нас відбувається, все сенсонесуче, те, що ми усвідомлюємо, проходить саме там, за вухами.

Чому це важливо? Тому що часто потрібне для розуміння нейронних мереж. По-перше, все про це розповідають, і я вже звикла, що так відбувається, а по-друге, річ у тому, що всі області, які використовуються в нейронних мережах для розпізнавання образів, прийшли до нас саме з вентрального зорового шляху, де кожна Маленька зона відповідає за свою строго певну функцію.

Зображення потрапляє до нас із сітківки ока, проходить низку зорових зон і закінчується у скроневій зоні.

У далекі 60-ті роки минулого століття, коли починалося вивчення зорових зон мозку, перші експерименти проводилися на тваринах, тому що не було fMRI. Досліджували мозок за допомогою електродів, вживлених у різні зорові зони.

Перша зорова зона була досліджена Девідом Х'юбелем та Торстеном Візелем у 1962 році. Вони проводили експерименти на кішках. Кішкам показувалися різні об'єкти, що рухаються. На що реагували клітини мозку, те було тим стимулом, яке розпізнавала тварина. Навіть зараз багато експериментів проводяться цими драконівськими способами. Проте це найефективніший спосіб дізнатися, що робить кожна найдрібніша клітина в нашому мозку.

У такий же спосіб були відкриті ще багато важливих властивостей зорових зон, які ми використовуємо в deep learning зараз. Одна з найважливіших властивостей – це збільшення рецептивних полів наших клітин у міру просування від первинних зорових зон до скроневих часток, тобто пізніших зорових зон. Рецептивне поле - це частина зображення, яку обробляє кожна клітина нашого мозку. Кожна клітина має своє рецептивне поле. Ця ж властивість зберігається і в нейронних мережах, як ви, мабуть, все знаєте.

Також із зростанням рецептивних полів збільшуються складні стимули, які зазвичай розпізнають нейронні мережі.

Тут ви бачите приклади складності стимулів, різних двовимірних форм, які розпізнаються в зонах V2, V4 та різних частинах скроневих полів у макак. Також проводяться кілька експериментів на МРТ.

Тут ви бачите, як проводять такі експерименти. Це 1 нанометрова частина зон IT cortex a мавпи при розпізнаванні різних об'єктів. Підсвічено те, де розпізнається.

Підсумуємо. Важлива властивість, яку ми хочемо запозичити у зорових зон - це те, що зростають розміри рецептивних полів, і збільшується складність об'єктів, які ми розпізнаємо.

Комп'ютерний зір

До того, як ми навчилися це застосовувати до комп'ютерного зору - загалом, як його не було. Принаймні воно працювало не так добре, як працює зараз.

Всі ці властивості ми переносимо в нейронну мережу, і ось воно запрацювало, якщо не включати невеликий відступ до датасет, про який розповім пізніше.

Але спочатку трохи про найпростіший перцептрон. Він також утворений за образом та подобою нашого мозку. Найпростіший елемент, що нагадує клітину мозку - нейрон. Має вхідні елементи, які за умовчанням розташовуються ліворуч, зрідка знизу вгору. Ліворуч це вхідні частини нейрона, праворуч вихідні частини нейрона.

Найпростіший перцептрон здатний виконувати лише найпростіші операції. Для того, щоб виконувати складніші обчислення, нам потрібна структура з великою кількістю прихованих шарів.

У випадку комп'ютерного зору нам потрібно ще більше прихованих шарів. І лише тоді система осмислено розпізнаватиме те, що вона бачить.

Отже, що відбувається при розпізнаванні зображення, я розповім з прикладу осіб.

Для нас подивитися на цю картинку і сказати, що на ній зображено саме обличчя статуї досить просто. Однак до 2010 року для комп'ютерного зору це було надзвичайно складним завданням. Ті, хто займався цим питанням до цього часу, напевно, знають, наскільки важко було описати об'єкт, який ми хочемо знайти на картинці без слів.

Нам потрібно це було зробити якимось геометричним способом, описати об'єкт, описати взаємозв'язки об'єкта, як можуть ці частини ставитися один до одного, потім знайти це зображення на об'єкті, порівняти їх і отримати, що ми розпізнали погано. Зазвичай це було трохи краще, ніж підкидання монети. Ледве краще, ніж chance level.

Нині це відбувається не так. Ми розбиваємо наше зображення або на пікселі, або на деякі патчі: 2х2, 3х3, 5х5, 11х11 пікселів - як зручно творцям системи, в якій вони є вхідним шаром в нейронну мережу.

Сигнали з цих вхідних шарів передаються від шару до шару за допомогою синапсів, кожен із шарів має свої певні коефіцієнти. Отже, ми передаємо від шару до шару, від шару до шару, доки ми не отримаємо, що ми розпізнали обличчя.

Умовно всі ці частини можна розділити на три класи, ми їх позначимо X, W та Y, де Х – це наше вхідне зображення, Y – це набір лейблів, і нам потрібно отримати наші ваги. Як ми обчислимо W?

За наявності нашого Х та Y це, здається, просто. Однак те, що позначено зірочкою, є дуже складною нелінійною операцією, яка, на жаль, не має зворотної. Навіть маючи 2 задані компоненти рівняння, дуже складно її обчислити. Тому нам потрібно поступово, методом спроб та помилок, підбором ваги W зробити так, щоб помилка максимально зменшилася, бажано, щоб стала рівною нулю.

Цей процес відбувається ітеративно, ми постійно зменшуємо, поки не знаходимо значення ваги W, яке нас досить влаштує.

До речі, жодна нейронна мережа, з якою я працювала, не досягала помилки, що дорівнює нулю, але працювала при цьому досить добре.

Перед вами перша мережа, яка перемогла на міжнародному змаганні ImageNet у 2012 році. Це так званий AlexNet. Це мережа, яка вперше заявила про себе, про те, що існує convolutional neural networks і з тих пір на всіх міжнародних змаганнях вже convolutional neural nets не здавали своїх позицій ніколи.

Незважаючи на те, що ця мережа досить дрібна (в ній лише 7 прихованих шарів), вона містить 650 тисяч нейронів із 60 мільйонами параметрів. Для того, щоб ітеративно навчитися знаходити потрібні ваги, нам потрібне дуже багато прикладів.

Нейронна мережа навчається на прикладі картинки та лейбла. Як нас у дитинстві вчать "це кішка, а це собака", так само нейронні мережі навчаються на великій кількості картинок. Але справа в тому, що до 2010 року не існувало досить великого data set'a, який міг би навчити таку кількість параметрів розпізнавати зображення.

Найбільші бази даних, які існували до цього часу: PASCAL VOC, який мав всього 20 категорій об'єктів, і Caltech 101, який був розроблений в California Institute of Technology. В останньому була 101 категорія, і це було багато. Тим же, хто не зумів знайти свої об'єкти в жодній із цих баз даних, доводилося коштувати свої бази даних, що, я скажу, страшно болісно.

Однак у 2010 році з'явилася база ImageNet, в якій було 15 мільйонів зображень, поділених на 22 тисячі категорій. Це вирішило нашу проблему навчання нейронних мереж. Зараз усі охочі, хто має якусь академічну адресу, можуть спокійно зайти на сайт бази, запросити доступ і отримати цю базу для тренування своїх нейронних мереж. Вони відповідають досить швидко, як на мене, наступного дня.

Порівняно з попередніми data set'ами це дуже велика база даних.

На прикладі видно, наскільки мало все те, що було до неї. Одночасно з базою ImageNet з'явилося змагання ImageNet, міжнародний challenge, у якому всі команди, які бажають позмагатися, можуть взяти участь.

Цього року перемогла мережа, створена у Китаї, у ній було 269 шарів. Не знаю, скільки параметрів, підозрюю, також багато.

Архітектура глибинної нейронної мережі

Умовно її можна розділити на 2 частини: ті, що навчаються, і ті, які не навчаються.

Чорним позначені ті частини, які навчаються, решта верств здатні вчитися. Існує безліч визначень того, що знаходиться всередині кожного згорткового шару. Одне з прийнятих позначень - один шар із трьома компонентами поділяють на convolution stage, detector stage та pooling stage.

Не вдаватимуся до деталей, ще буде багато доповідей, у яких докладно розглянуто, як це працює. Розповім на прикладі.

Оскільки організатори просили мене не згадувати багато формул, я їх зовсім викинула.

Отже, вхідне зображення потрапляє у мережу шарів, які можна назвати фільтрами різного розміру та різної складності елементів, які вони розпізнають. Ці фільтри становлять якийсь свій індекс чи набір ознак, який потім потрапляє до класифікатора. Зазвичай це або SVM або MLP - багатошаровий перцептрон, кому що зручно.

За образом та подобою з біологічною нейронною мережею об'єкти розпізнаються різної складності. У міру збільшення кількості шарів це все втратило зв'язок із cortex'ом, оскільки там обмежена кількість зон у нейронній мережі. 269 ​​або багато зон абстракції, тому зберігається тільки збільшення складності, кількості елементів і рецептивних полів.

Якщо розглянути на прикладі розпізнавання облич, то у нас рецептивне поле першого шару буде маленьким, потім трохи більше, більше, і так доти, поки нарешті ми не зможемо розпізнавати вже обличчя цілком.

З точки зору того, що знаходиться у нас усередині фільтрів, спочатку будуть похилі палички плюс трохи кольору, потім частини облич, а потім вже цілком обличчя будуть розпізнаватись кожною клітиною шару.

Є люди, які стверджують, що людина завжди розпізнає краще за мережу. Чи так це?

2014 року вчені вирішили перевірити, наскільки ми добре розпізнаємо в порівнянні з нейронними мережами. Вони взяли дві найкращі на даний момент мережі - це AlexNet і мережа Меттью Зіллера і Фергюса, і порівняли з відгуком різних зон мозку макакі, яка теж була навчена розпізнавати якісь об'єкти. Об'єкти були з тваринного світу, щоб мавпа не заплуталася, і були проведені експерименти, хто ж краще розпізнає.

Так як отримати відгук від мавпи виразно неможливо, їй вживили електроди і міряли безпосередньо відгук кожного нейрона.

Виявилося, що в нормальних умовах клітини мозку реагували так само добре, як і state of the art model на той момент, тобто мережу Меттью Зіллера.

Однак при збільшенні швидкості показу об'єктів, збільшенні кількості шумів та об'єктів на зображенні швидкість розпізнавання та його якість нашого мозку та мозку приматів сильно падають. Навіть найпростіша згорткова нейронна мережа розпізнає об'єкти краще. Тобто офіційно нейронні мережі працюють краще за наш мозок.

Класичні завдання згорткових нейронних мереж

Їх насправді не так багато, вони належать до трьох класів. Серед них - такі завдання, як ідентифікація об'єкта, семантична сегментація, розпізнавання облич, розпізнавання частин тіла людини, семантичне визначення меж, виділення об'єктів уваги на зображенні та виділення нормалей до поверхні. Їх умовно можна поділити на 3 рівні: від найнижчих рівнів до самих високорівневих завдань.

На прикладі цього зображення розглянемо, що робить кожне із завдань.

  • Визначення кордонів- це найбільш низькорівневе завдання, для якої вже класично застосовуються згорткові нейронні мережі.
  • Визначення вектора до нормалідозволяє нам реконструювати тривимірне зображення із двомірного.
  • Saliency, визначення об'єктів уваги- це те, на що звернула б увагу людина при розгляді цієї картинки.
  • Семантична сегментаціядозволяє розділити об'єкти на класи за їхньою структурою, нічого не знаючи про ці об'єкти, тобто ще до їхнього розпізнавання.
  • Семантичне виділення кордонів- Це виділення кордонів, розбитих на класи.
  • Виділення частин тіла людини.
  • І найвищерівневе завдання - розпізнавання самих об'єктів, яке ми зараз розглянемо з прикладу розпізнавання осіб.

Розпізнавання осіб

Перше, що ми робимо - пробігаємо face detector"ом за зображенням для того, щоб знайти обличчя. Далі ми нормалізуємо, центруємо обличчя і запускаємо його на обробку в нейронну мережу. Після чого отримуємо набір або вектор ознак, що однозначно описує фічі цієї особи.

Потім ми можемо цей вектор ознак порівняти з усіма векторами ознак, які у нашій базі даних, і отримати відсилання на конкретну людину, з його ім'я, з його профіль - усе, що може зберігатися у базі даних.

Саме таким чином працює наш продукт FindFace – це безкоштовний сервіс, який допомагає шукати профілі людей у ​​базі «ВКонтакті».

Крім того, у нас є API для компаній, які хочуть скуштувати наші продукти. Ми надаємо сервіс з детектування осіб, по верифікації та ідентифікації користувачів.

Зараз у нас розроблено 2 сценарії. Перший – це ідентифікація, пошук особи за базою даних. Друге - це верифікація, це порівняння двох зображень з певною ймовірністю, що це одна і та сама людина. Крім того, у нас зараз у розробці розпізнавання емоцій, розпізнавання зображень на відео та liveness detection – це розуміння, чи жива людина перед камерою чи фотографія.

Небагато статистики. При ідентифікації, при пошуку по 10 тисяч фото у нас точність близько 95% залежно від якості бази, 99% точність верифікації. І крім цього даний алгоритм дуже стійкий до змін - нам необов'язково дивитися в камеру, у нас можуть бути якісь предмети, що загороджують: окуляри, сонячні окуляри, борода, медична маска. У деяких випадках ми можемо перемогти навіть такі неймовірні складності для комп'ютерного зору, як окуляри, і маска.

Дуже швидкий пошук, витрачається 0,5 секунди на обробку 1 мільярда фотографій. Нами розроблено унікальний індекс швидкого пошуку. Також ми можемо працювати із зображеннями низької якості, отриманих із CCTV-камер. Ми можемо обробляти все це в режимі реального часу. Можна завантажувати фото через веб-інтерфейс, через Android, iOS і шукати 100 мільйонів користувачів та їх 250 мільйонів фотографій.

Як я вже говорила, ми зайняли перше місце на MegaFace competition - аналог для ImageNet, але для розпізнавання осіб. Він проводиться вже кілька років, торік ми були найкращими серед 100 команд з усього світу, включаючи Google.

Рекурентні нейронні мережі

Recurrent neural networks ми використовуємо тоді, коли нам недостатньо розпізнавати лише зображення. У тих випадках, коли нам важливо дотримуватись послідовності, нам потрібен порядок того, що у нас відбувається, ми використовуємо звичайні нейронні мережі.

Це застосовується для розпізнавання природної мови, обробки відео, навіть використовується для розпізнавання зображень.

Про розпізнавання природної мови я не розповідатиму - після моєї доповіді ще будуть дві, які будуть спрямовані на розпізнавання природної мови. Тому я розповім про роботу рекурентних мереж на прикладі розпізнавання емоцій.

Що таке рекурентні нейронні мережі? Це приблизно те саме, що й звичайні нейронні мережі, але зі зворотним зв'язком. Зворотній зв'язок нам потрібний, щоб передавати на вхід нейронної мережі або на якийсь із її шарів попередній стан системи.

Припустимо, ми опрацьовуємо емоції. Навіть в посмішці - однієї з найпростіших емоцій - є кілька моментів: від нейтрального виразу обличчя до того моменту, коли ми матимемо повну посмішку. Вони йдуть один за одним послідовно. Щоб це добре розуміти, нам треба вміти спостерігати, як це відбувається, передавати те, що було на попередньому кадрі в наступний крок роботи системи.

У 2005 році на змаганні Emotion Recognition in the Wild спеціально для розпізнавання емоцій команда з Монреалю представила рекурентну систему, яка була дуже простою. У неї було лише кілька згорткових шарів, і вона працювала виключно з відео. Цього року вони додали також розпізнавання аудіо та загрегували покадрові дані, які виходять із convolutional neural networks, дані аудіосигналу з роботою рекурентної нейронної мережі (з поверненням стану) та здобули перше місце на змаганні.

Навчання з підкріпленням

Наступний тип нейронних мереж, який дуже часто використовується останнім часом, але не набув такого широкого розголосу, як попередні 2 типи - це deep reinforcement learning, навчання з підкріпленням.

Справа в тому, що у попередніх двох випадках ми використовуємо бази даних. У нас є дані з осіб, або дані з картинок, або дані з емоціями з відеороликів. Якщо ми цього не маємо, якщо ми не можемо це зняти, як навчити робота брати об'єкти? Це ми робимо автоматично – ми не знаємо, як це працює. Інший приклад: складати великі бази даних у комп'ютерних іграх складно, та й не потрібно, можна зробити набагато простіше.

Всі, напевно, чули про успіхи deep reinforcement learning в Atari і в го.

Хто чув про Atari? Ну, хтось чув, добре. Про AlphaGo думаю чули всі, тому я навіть не розповідатиму, що конкретно там відбувається.

Що відбувається в Atari? Зліва якраз зображено архітектуру цієї нейронної мережі. Вона навчається, граючи сама з собою для того, щоб отримати максимальну винагороду. Максимальна винагорода – це максимально швидкий результат гри з максимально великим рахунком.

Справа вгорі - останній шар нейронної мережі, який зображує всю кількість станів системи, яка грала сама проти себе лише протягом двох годин. Червоним зображені бажані результати гри з максимальною винагородою, а блакитною – небажані. Мережа будує якесь поле і рухається своїми навченими верствами у той стан, якого їй хочеться досягти.

У робототехніці ситуація трохи по-іншому. Чому? Тут ми маємо кілька складнощів. По-перше, у нас не так багато баз даних. По-друге, нам потрібно координувати відразу три системи: сприйняття робота, його дії за допомогою маніпуляторів та його пам'ять – те, що було зроблено у попередньому кроці і як це було зроблено. Загалом, це все дуже складно.

Справа в тому, що жодна нейронна мережа, навіть deep learning на даний момент, не може впоратися з цим завданням досить ефективно, тому deep learning тільки виключно шматочки того, що потрібно зробити роботам. Наприклад, нещодавно Сергій Левін надав систему, яка вчить робота вистачати об'єкти.

Ось тут показано досліди, які він проводив на своїх 14 роботах-маніпуляторах.

Що тут відбувається? У цих тазиках, які ви перед собою бачите, різні об'єкти: ручки, ластики, кухлі поменше і побільше, ганчірочки, різні текстури, різної жорсткості. Неясно, як навчити робота захоплювати їх. Протягом багатьох годин, і навіть, начебто, тижнів, роботи тренувалися, щоб вміти захоплювати ці предмети, складалися з цього приводу бази даних.

Бази даних - це певний відгук середовища, який потрібно накопичити у тому, щоб мати можливість навчити робота щось робити надалі. Надалі роботи будуть навчатися на цій множині станів системи.

Нестандартні застосування нейронних мереж

Це, на жаль, кінець, у мене не багато часу. Я розповім про ті нестандартні рішення, які зараз є і які, за багатьма прогнозами, матимуть якийсь додаток у майбутньому.

Отже, вчені Стенфорда нещодавно вигадали дуже незвичайне застосування нейронної мережі CNN для передбачення бідності. Що вони зробили?

Насправді, концепція дуже проста. Справа в тому, що в Африці рівень бідності зашкалює за всі мислимі та немислимі межі. У них навіть немає можливості збирати соціальні демографічні дані. Тому з 2005 року ми взагалі не маємо жодних даних про те, що там відбувається.

Вчені збирали денні та нічні карти з супутників і згодовували їх нейронні мережі протягом деякого часу.

Нейронна мережа була налаштована на ImageNet. Тобто перші шари фільтрів були налаштовані так, щоб вона вміла розпізнавати вже якісь зовсім прості речі, наприклад, дахи будинків, для пошуку поселення на денних картах. Потім денні карти були зіставлені з картами нічної освітленості тієї ж ділянки поверхні для того, щоб сказати, наскільки є гроші у населення, щоб хоч би висвітлювати свої будинки протягом нічного часу.

Тут ви бачите результати прогнозу, побудованого нейронною мережею. Прогноз було зроблено з різним дозволом. І ви бачите - останній кадр - реальні дані, зібрані урядом Уганди в 2005 році.

Можна помітити, що нейронна мережа склала досить точний прогноз навіть з невеликим зрушенням з 2005 року.

Були звичайно й побічні ефекти. Вчені, які займаються deep learning, завжди з подивом виявляють різні побічні ефекти. Наприклад, як ті, що мережа навчилася розпізнавати воду, ліси, великі будівельні об'єкти, дороги – все це без вчителів, без заздалегідь побудованих баз даних. Загалом повністю самостійно. Були деякі верстви, які реагували, наприклад, на дороги.

І останнє застосування про яке я хотіла б поговорити – семантична сегментація 3D зображень у медицині. Взагалі, medical imaging - це складна область, з якою дуже складно працювати.

На це є кілька причин.

  • В нас дуже мало баз даних. Не так легко знайти картинку мозку, до того ж пошкодженого, і взяти її теж нізвідки не можна.
  • Навіть якщо у нас є така картинка, потрібно взяти медика та змусити його вручну розміщувати всі багатошарові зображення, що дуже довго та вкрай неефективно. Не всі медики мають ресурси, щоб цим займатися.
  • Потрібна дуже висока точність. Медична система може помилятися. При розпізнаванні, наприклад, котиків, не розпізнали нічого страшного. А якщо ми не розпізнали пухлину, це вже не дуже добре. Тут особливо люті вимоги до надійності системи.
  • Зображення в тривимірних елементах - вокселях, не в пікселях, що завдає додаткових труднощів розробникам систем.
Але як обійшли це питання у цьому випадку? CNN була двоструменева. Одна частина обробляла нормальніший дозвіл, інша - трохи більш погіршений дозвіл для того, щоб зменшити кількість шарів, які нам потрібно навчати. За рахунок цього трохи скоротився час на тренування мережі.

Де це застосовується: визначення пошкоджень після удару, пошуку пухлини в мозку, в кардіології визначення того, як працює серце.

Ось приклад визначення обсягу плаценти.

Автоматично це працює добре, але не настільки, щоб це було випущено у виробництво, тому поки що тільки починається. Є кілька стартапів для створення таких систем медичного зору. Загалом у deep learning дуже багато стартапів найближчим часом. Кажуть, що venture capitalists останні півроку виділили більше бюджету на стартапи обросту deep learning, ніж за минулі 5 років.

Ця область активно розвивається, багато цікавих напрямів. Ми з вами живемо у цікавий час. Якщо ви займаєтеся deep learning, то вам, напевно, настав час відкривати свій стартап.

Ну, на цьому я, напевно, закруглюся. Спасибі вам велике.

Сьогодні ми спостерігаємо бум у розвитку інформаційних технологій та їх поступове, а часом і революційне впровадження у наше життя

Цифровізація, робототизація, штучний інтелект, штучні нейронні мережі… Скільки нових понять та термінів вже сьогодні розсувають горизонти можливого, змушуючи замислюватися та розбиратися в них, шукати їх прикладне ефективне та безпечне застосування. І все-таки, якими б перспективними не були нові технології – всі вони є продуктами життєдіяльності людини, її розуму, роботи мозку та мислення.

Що таке нейрон?

Середньостатистичний людський мозок – це близько 86 млрд нейронів, з'єднаних численними зв'язками (загалом кілька тисяч зв'язків однією нейрон, проте це може сильно коливатися). Нейрони – це спеціальні клітини, які здатні поширювати електрохімічні сигнали. Нейрон має розгалужену структуру введення інформації (дендрити), ядро ​​і вихід, що розгалужується (аксон). Аксони клітини поєднуються з дендритами інших клітин за допомогою синапсів. При активації нейрон посилає електрохімічний сигнал свого аксону. Через синапс цей сигнал досягає інших нейронів, які можуть у свою чергу активуватися. Нейрон активується тоді, коли сумарний рівень сигналів, які у його ядро ​​з дендритів, перевищить певний рівень (поріг активації).

Нейронні мережі

Штучні нейронні мережі, штучний інтелект, машинне навчання… Що означають усі ці нині модні напрямки та терміни?

У загальному значенні слова, нейронні мережі (НС - Neural Networks) - це математичні моделі, що працюють за принципом мереж нервових клітин тваринного організму. Штучні НС (ІНС) можуть бути реалізовані як програмовані, так і в апаратні рішення. Для простоти сприйняття нейрон можна уявити, як якийсь осередок, яка має безліч вхідних отворів і одне вихідне. Яким чином численні вхідні сигнали формуються у вихідний, саме визначає алгоритм обчислення. На кожен вхід нейрона подаються діючі значення, які потім поширюються міжнейронним зв'язкам (синопсисам). У синапсів є один параметр - вага, завдяки якому вхідна інформація змінюється під час переходу від одного нейрона до іншого.

Тенденція часу

Останні кілька років спостерігається вибух інтересу до ІНС. Дослідники – програмісти та розробники апаратних моделей – створюють нові ефективні креативні програмні та апаратні втілення, побудовані за принципом організації та функціонування біологічних нейронних мереж. Нейронні мережі привабливі з інтуїтивної точки зору, бо вони ґрунтуються на біологічній моделі нервових систем. У майбутньому розвиток таких нейробіологічних моделей може призвести до створення дійсно мислячих комп'ютерів. А щоб створити штучний інтелект, необхідно побудувати систему зі схожою архітектурою.

Де вони застосовуються

ІНС завдяки здатності до навчання, а також тому, що це обумовлено появою різних способів прискорення їх навчання, успішно застосовуються в різних галузях нашого життя: бізнесі, медицині, техніці, геології, фізиці та ін. ІНС, як виключно потужний метод моделювання, що дозволяє відтворювати надзвичайно складні залежності, знаходить все більш численні сфери застосування: створення самонавчених систем виробничих процесів, безпілотні транспортні засоби, системи розпізнавання образів, інтелектуальні охоронні системи, робототехніка, системи моніторингу якості, голосові інтерфейси взаємодії, системи аналітики та винаходи в багатьох інших областях, де Необхідно вирішувати завдання обробки накопиченого великого потоку інформації – розпізнавання, прогнозування, класифікації, управління. В даний час процес навчання ІНС став набагато швидше і простіше: стали потужнішими можливості технічних засобів (технологічне зростання обсягів пам'яті, швидкодії; постійне накопичення баз даних та ін.). Почали активно розроблятися звані «добуткі» нейромережі, які дозволяють суттєво прискорити процес впровадження технології.

Одні плюси

Вражаючий успіх і інтерес до ІНС визначаються здібностями справлятися з такими завданнями, як системи розпізнавання та класифікації об'єктів на зображеннях і ландшафтах у досліджуваній області, голосовий інтерфейс взаємодії для інтернету речей, відеоаналітика, системи, що самонавчаються, оптимізують управління матеріальними потоками або розташуванням об'єктів; інтелектуальні; самонавчені системи управління виробничими процесами та пристроями (у тому числі робототехнічними), універсальний переклад «на льоту» для конференцій та персонального використання тощо. І якщо поки що рано говорити про те, чи зможуть колись нейромережі повністю відтворити можливості людського мозку, ймовірність того, що найближчим десятиліттям ІНС зможуть замінити людину на чверті існуючих професій, все більше стає схожою на правду.

Штучний інтелект

Що таке штучний інтелект? Під штучним інтелектом (ІІ) розробники розуміють здатність машини імітувати розумну поведінку людей, тобто - вміння орієнтуватися в контексті, що змінюється, і приймати з урахуванням цих змін оптимальні, що дозволяють досягти мети рішення. Лікарю буває складно правильно діагностувати захворювання, особливо якщо у нього не дуже багато практики або конкретний випадок далекий від професійного досвіду. Тут на допомогу може прийти ІІ, що має доступ до баз з тисячами та мільйонами історій хвороби (та іншою впорядкованою інформацією, у тому числі свіжим статтям, підручникам, спеціалізованою медичною літературою). За допомогою алгоритмів машинного навчання ІІ класифікує конкретний кейс, швидко просканує наукову літературу з потрібної теми, що вийшла за певний інтервал часу, вивчить наявні в доступі схожі випадки і запропонує план лікування. Більше того, ІІ зможе забезпечити індивідуалізований підхід, взявши до уваги відомості про генетичні особливості пацієнта, патерни руху, зібрані його пристроями, що носилися, попередньої історії хвороб – усім анамнезі життя. ІІ ймовірно (принаймні на поточному етапі розвитку технологій), не замінить лікаря, але може стати і стає корисним інструментом, помічником у справі діагностики та лікування.

Навіщо він потрібний у медицині

Медицина, що орієнтувалася раніше в основному на лікування гострих захворювань, тепер зможе більше уваги приділяти хронічним недугам, багато з яких не так давно і хворобами не вважалися. Вже сьогодні швидко зростають обсяги медичних даних, приходить свідомість, що від швидкості та якості аналізу залежить здоров'я та якість життя пацієнта. Лікарі часто стикаються з необхідністю лікувати ожиріння, депресії, хвороби похилого віку. Діабет, серцева недостатність, аутоімунні розлади все частіше діагностуються поза фазою загострення, на ранніх стадіях, причому йдеться не тільки про підтримуючу терапію, але і про можливість повністю вилікувати, виправити ці системні збої організму. Розвивається превентивна медицина, що дозволяє розпізнати схильність до певних типів захворювань ще до їх прояву, та необхідної актуальності вчасно вжити заходів. І все це – робота для ІІ.

Прогноз для стоматології

Дослідники, які займаються ІНС, роблять прогнози, що вже найближчим часом швидко розвиватиметься застосування нейронних мереж та в стоматології. Цей напрямок дозволить проводити швидший аналіз великої кількості необхідної професійної прицільно-орієнтованої інформації, а головне – зможе спрямовувати та підказувати лікарям у вирішенні складних клінічних завдань.

Матеріал підготувала за даними
інтернет-джерел Галина Масіс

Пошуки та вивчення неявних алгоритмів, що дозволяють автоматично накопичувати і потім використовувати досвід при навчанні [5.3], продовжуються вже понад 100 років [5.4]. Однак перші серйозні спроби створення нейронних мереж були зроблені в 40-50-х роках, коли Маккалох і Пітс висунули основні положення теорії роботи головного мозку. З появою дешевих ЕОМ відбувся різкий стрибок у цій галузі, яка на початку 80-х років сформувалася у цілу науку - нейроінформатику [5.5, 5.6, 5.7].

Неявні завдання медицини та біології стали ідеальним полем для застосування нейромережевих технологій, і саме в цій галузі спостерігається найбільш яскравий практичний успіх нейроінформаційних методів.

Розглянемо кілька найцікавіших нейромережевих додатків для біології та медицини, створених різними авторами та школами.

Найбільший інтерес для практичної охорони здоров'я становлять системи для діагностики та диференціальної діагностики захворювань. При цьому для прийняття рішеньможуть використовуватися найрізноманітніші дані - анамнез, клінічний огляд (створюються експертні системи діагностики, що обмежуються лише цим набором [5.8]), результати лабораторних тестів та складних функціональних методів. Список областей медицини, в яких почали застосовувати нові технології, надзвичайно широкий і продовжує зростати.

Одним з найбільш інтенсивних напрямків є застосування нейромереж у кардіології.

В Італії розроблено надзвичайно цікаву експертна системадля діагностики та лікування артеріальної гіпертонії [5.9]. Система включає три нейромережевих модуля, причому відповіді одних є вхідними даними для інших. На початку дослідження хворому проводять вимірювання систолічного та діастолічного тиску кожні півгодини протягом доби. Дані за кожну годину усереднюються. Таким чином, утворюється масив з 48 величин артеріального тиску (24 для систолічного і діастолічного). Після цього перший модуль , що складається з двох тришарових нейромереж (у кожній з яких 2 вхідних, 4 "прихованих" і 24 вихідних нейрона), на підставі даних про поле і вік хворого розраховує аналогічні "належні" величини і порівнюють їх з реальними. Паралельно другий модуль (двошарова нейромережа з 17 вхідними та 4 вихідними нейронами) на підставі клінічних даних (симптоматика, анамнез) розраховує можливі поєднання гіпотензивних лікарських засобів, які можуть бути використані для лікування даного хворого. Дані, зняті з виходів обох модулів, разом із клінічними даними подаються на вхід останнього, третього модуля (6-шарова нейромережа). Цей модуль оперує 4 групами гіпотензивних препаратів (діуретики, бетаадреноблокатори, інгібітори ангіотензину, блокатори кальцієвих каналів). Мета - призначити добовий (погодинний) графік прийому хворим на ліки кожної (якщо потрібно) з 4 груп. Тому цей модуль має 96 вихідних нейронів(4 препарати х 24 години). З кожного вихідного нейроназнімається доза, що відповідає одному препарату, який призначається на даний час доби. Природно, що у реальній ситуації більшість вихідних даних дорівнюють нулю. Таким чином, створюється оптимальна для пацієнта схема лікування гіпертонії. Слід зазначити, що система враховує деякі особливості прийому препаратів хворими, наприклад, утруднення прийому препаратів уночі (призначає нічний прийом лише крайніх випадках), заборона призначення сечогінних ліків проти ночі.

Відмінною рисою системи є можливість користувача (лікаря) передавати нейронній мережі свій досвід. Для цього творцями програми передбачено спеціальний блок, який виводить на екран комп'ютера добові криві артеріального тиску та пропонує лікареві ввести до комп'ютера добову схему прийому гіпотензивних препаратів у необхідних, на його думку, дозах. Введений приклад міститься у базі даних. Будь-коли можна ініціювати доучування нейронних мереж з новими прикладами.

Проводиться комплекс досліджень з використання нейромереж для діагностики інфаркту міокарда [5.13, 5.14, 5.15]. Автор наводить дані щодо чутливості (77,7%) та специфічності (97,2%) нейромережевого тесту. У роботі [5.16], крім того, за допомогою нейронної мережі встановлювали діагностичну значущість клінічних параметрів під час діагностики інфаркту міокарда.

Нейросети використовуються терапевтами для діагностики захворювань печінки за лабораторними даними дослідження функцій печінки [5.19]; диференціальної діагностики захворювань печінки [5.20] та жовчного міхура по УЗД [5.21].

Нейропрограми можуть успішно працювати з медичними даними, які стосуються суб'єктивних категорій, наприклад, у психіатрії [5.22 ]. Оцінка суб'єктивних даних дає можливість розпізнавання психічних симптомів та діагностики та вивчення деяких психіатричних симптомокомплексів.

Актуальна проблема діагностики злоякісних новоутворень можливо отримає новий рівень осмислення з початком застосування нейроалгоритмів. Так, у роботі [5.23] показана 80%-я точність ранньої діагностики меланом шкіри - одного з найбільш злоякісних захворювань.

Одним із серйозних напрямків застосування нейронних мереж є інтерпретація медичних даних. В останні роки йде бурхливий розвиток нових засобів діагностики та лікування. При цьому спостерігається "друга хвиля" вивчення та використання стародавніх, старовинних методів, і, навпаки, застосування останніх технічних новацій. Нерідко й ті й інші методи при використанні надають лікарю безліч різноманітних даних. При цьому постає проблема їхньої грамотної та коректної інтерпретації. Пошук глибинних закономірностей між одержуваними даними та патологічними процесами починає відставати від розробки нових і нових методів, тому застосування цієї мети нейромереж може виявитися надзвичайно вигідним.

по 5 точках цієї хвилі нейронна мережа оцінює стан лівої нирки.

Класичною проблемою в кардіології є інтерпретація електрокардіограм, що потребує значного досвіду лікаря. Співробітники Університету Глазго (Великобританія) ведуть дослідження щодо застосування нейромереж для ЕКГ-діагностики інфарктів міокарда [5.25]. Вхідними даними для мереж є обрані параметри 12-канальної електрокардіограми та 12-канальної векторкардіограми (довжини зубців, відстані між зубцями). Дослідники навчили безліч нейромереж (167 мереж для діагностики інфаркту міокарда передньої стінки і 139 мереж для інфаркту нижньої стінки) на масиві даних з 360 електрокардіограм. Навчені мережі потім тестували окрему вибірку із заздалегідь відомими відповідями (493 випадки). Одночасно для отримання окремої серії відповідей на вибірці, що тестується, був використаний логічний метод (із заздалегідь заданим алгоритмом). Потім порівнювалися результати тестування вибірки кращими нейромережами та за допомогою логічного алгоритму. Порівняння показало, що у багатьох випадках чутливість і специфічність нейромережевого тесту виявилися вищими, ніж у логічного методу. Автори роблять справедливий висновок, що у випадках, коли логічний алгоритм вирішення завдання все-таки можна вибудувати, розумно комбінувати в експертних системах обидва підходи.

Інтерпретація 59%).

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_1.jpg" alt=">Нейронні мережі в медицині StatSoft Russia">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_2.jpg" alt=">Основні ідеї нейромережевих методів аналізу Простота та однорідність окремих елементів - «нейрон » Всі основні"> Основные идеи нейросетевых методов анализа Простота и однородность отдельных элементов - «нейронов» Все основные свойства сети определяются структурой связей Избыточность системы гарантирует ее надежность как целого Связи формируются по неявным правилам в процессе «обучения»!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_3.jpg" alt=">Приклади штучних нейронних мереж">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_4.jpg" alt=">Особливості нейромережевого підходу до аналізу даних Пропонує стандартний спосіб вирішення багатьох нестандартних завдань ."> Особенности нейросетевого подхода к анализу данных Предлагает стандартный способ решения многих нестандартных задач. Явное описание модели заменяется созданием «образовательной среды». Приводит к успеху там, где отказывают традиционные методы и трудно создать явный алгоритм.!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_5.jpg" alt=">Для практичної охорони здоров'я особливий інтерес представляють експертні системи для діагностики захворювань">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_6.jpg" alt=">Приклади застосування нейронних мереж у медицині Виявлення атеросклеротичних бляшок за допомогою аналізів спектрів."> Примеры применения нейронных сетей в медицине Выявление атеросклеротических бляшек с помощью анализа флюоресцентных спектров. Диагностика заболеваний периферических сосудов. Диагностика инфаркта миокарда. Диагностика клапанных шумов сердца с помощью анализа акустических сигналов. Распознавание психических симптомов.!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_7.jpg" alt=">Експертна система для лікування артеріальної гіпертонії (Італія) Модуль 1 Модуль 2 Модуль 3 Погодинні"> Экспертная система для лечения артериальной гипертонии (Италия) Модуль 1 Модуль 2 Модуль 3 Почасовые измерения давления Возраст и пол Характеристики состояния Характеристики лекарственных препаратов Структура почасового приема препаратов Другие клинические данные!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_8.jpg" alt=">Визначення накопиченої дози радіоактивного опромінення (Красноярська мед. академія) Клас 4 групи з"> Определение накопленной дозы радиоактивного облучения (Красноярская мед. академия) Классификация на 4 группы по величине накопленной дозы облучения 35 входных параметров Естественная Слабая Средняя Сильная Сеть обучалась на данных о пациентах, работающих в атомной промышленности. Со 100% правильностью такая сеть классифицирует состояние людей, в том числе и тех, кто не работает в данной отрасли.!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_9.jpg" alt=">Етапи нейромережевого аналізу Дослідження взаємозв'язку змінних і зниження розмірності Побудова і зниження розмірності"> Этапы нейросетевого анализа Исследование взаимосвязи переменных и понижение размерности Построение и обучение сетей разных типов Сравнение качества сетей и их статистических характеристик!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_10.jpg" alt=">Зниження розмірності: відбір вхідних ознак Штраф за елемент, число популяцій та поколінь бітових"> Понижение размерности: отбор входных признаков Штраф за элемент, число популяций и поколений битовых строк Генетический алгоритм, пошаговое включение и исключение признаков!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_11.jpg" alt=">Зниження розмірності: автоасоціативні мережі Нові вхідні змінні для нейромережевої моделі">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_12.jpg" alt=">Завдання класифікації стану хворих на ішемічну хворобу">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_13.jpg" alt=">Нейронна мережа для діагностики розвитку ішемічної хвороби За набором показників (48 ),"> Нейронная сеть для диагностики развития ишемической болезни По набору показателей (48 переменных), как номинальных (например, «слабая-умеренная-сильная боль»), так и непрерывных (например, артериальное давление или возраст), классифицируется состояние пациентов с ишемической болезнью сердца. Номинальные переменные Непрерывные переменные!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_14.jpg" alt=">Результати класифікації та аналіз чутливості Всі спостереження класифіковані правильно Аналіз чутливості дозволяє стверджувати ,"> Результаты классификации и анализ чувствительности Все наблюдения классифицированы правильно Анализ чувствительности позволяет утверждать, что одним из важнейших факторов риска является привычка к курению.!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_15.jpg" alt=">Завдання діагностики онкологічного захворювання">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_16.jpg" alt=">Нейронні мережі для діагностики онкологічного захворювання Мережа на радіальних базисних функціях">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_17.jpg" alt=">Результати класифікації Багатошаровий персептрон: 100% спостережень класифіковано : 95% спостережень класифіковано"> Результаты классификации Многослойный персептрон: 100% наблюдений классифицировано правильно Радиальные базисные функции: 95% наблюдений классифицировано правильно!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_18.jpg" alt=">Налаштування мережі">!}

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_19.jpg" alt=">Бібліотеки функцій пакету STATISTICA Neural Networks для побудови, навчання та роботи нейронів мереж"> Библиотеки функций пакета STATISTICA Neural Networks для построения, обучения и работы нейронных сетей позволяют эффективно встраивать нейросетевые модули в разрабатываемые экспертные системы для прогнозирования и диагностики заболеваний!}