Як навчити машину думати? До чого тут фізика? І чому Нобелівський комітет згадав дослідження сорокарічної давності?
Два тижні тому Джон Хопфілд і Джеффрі Хінтон отримали Нобелівську премію з фізики за «фундаментальні відкриття і дослідження, що зробили можливим машинне навчання з використанням нейромереж». Але це доволі загальні слова. Тож розберемося, що саме вони зробили? Як навчили машини думати, наче людину?
А як думає людина?
Наш мозок складається з пов’язаних один з одним нейронів. Через ті зв’язки вони можуть обмінюватися імпульсами. Коли ми дізнаємося щось нове, формуються нові з’єднання, і нейрони буквально пов’язують одну інформацію з іншою.
Ті, хто програмував, знають, що сам по собі комп’ютер не зробить нічого. Треба завжди казати йому, що робити, Щось нове у комп’ютері з’явиться тільки якщо хтось його туди покладе.
Мозок — навпаки: сам по собі збирає інформацію і формує нові зв’язки. Тож як можна поєднати ці дві речі?..
Джон Хопфілд був тим, хто створив мережу, що здатна на це.
Як створити машину, що думає?
За освітою Джон Хопфілд — фізик. І коріння його наукових досліджень знаходяться саме у фізиці.
У 60-х роках вчені відкрили «спінове скло». Це спеціальні сплави, у яких у немагнітний матеріал домішані невеличкі магнітні частки. Вони мають магнітне поле, але те поле залишається невпорядкованим і хаотичним. Тобто, з’явився матеріал, який можна буде пізніше перетворити на систему, якщо навчитися його впорядковувати.
Цікаво, що одночасно, в ці ж роки нейробіологи усвідомили — нейрони формують нові зв’язки, вони вчаться активуватися разом. Меріан Даймонд опублікувала своє дослідження в 1964 році.
А вже у 1972 році японській вчений Сін’їті Амарі запропонував модифікувати модель, яка може змушувати атоми разом змінювати спін.
Хопфілд об’єднав всі ці дослідження у своїй праці 1982 року, де описав модель, що могла б навчатися. Ця модель згадується як мережа Хопфілда.
Але це був лише початок. Джеффрі Хінтон — когнітивний психолог і інформатик продовжив дослідження цієї теми та створив власну мережу.
Машина Больцмана
Вона мала кілька шарів. Ті, що були у центрі, залежали лише від інших шарів. На них не впливала зовнішня природа. Вхідні дані впливали на зовнішній шар, той впливав на приховані внутрішні, а той — на вихідний шар. Тобто Джеффрі Хінтон разом з Террі Сейновським у 1985 році винайшли систему, яка була здатна навчатися і навчати на кількох рівнях: створювати складні структури, схожі на ті, що у людському мозку, і здатні розпізнавати зображення. Тобто це був вже інший метод, який дозволив придумати важливий різновид нейронної мережі.
Вони назвали свій винахід «Машиною Больцмана» на честь фізика Людвіга Больцмана, що жив у дев’ятнадцятому сторіччі та вплинув на розвиток статистичної механіки.
Зараз всі сучасні нейромережі працюють за таким самим принципом: вузли розташовані у кілька рівнів, і, формуючи нові зв’язки, вони самостійно навчаються виконувати задачі.
У наш час, коли штучний інтелект набуває все більшої сили й ефективності, відкриття сорокарічної давності нарешті визнали важливим — бо саме на ньому стоїть все машинне навчання.
Хто знає, які давні відкриття з'являться у новому світлі наступного року?
Іван Синенко