Чому агенти зараз найпопулярніша тема у штучному інтелекті? Де їх можна застосувати? І як ШІ взагалі може бути самостійним?
«— Джарвіс, я хочу створити новий файл проєкту. Назви його «Марк II».
— Мені створити його на центральній базі даних Stark Industries?
— Не знаю, кому можу зараз довіряти. На моєму приватному сервері».
Чи прийшли фантастичні розмови до реальності?
ChatGPT вийшов вже понад два роки тому. Це було стрибком вперед у прогресі. Але за останні два роки розвиток штучного інтелекту не зупинявся ані на хвилину.
І останнє «диво» цього прогресу — це ШІ-агенти.
Насправді внутрішній устрій ШІ-агентів доволі простий
Велика мовна модель (як, наприклад, ChatGPT) слугує «мозком» агенту, який обробляє інформацію і приймає рішення.
Мовній моделі надані «інструменти» — інші програми, до яких модель звертається і за допомогою яких вона може втілювати свої рішення.
- Користувач задає ціль.
- Модель формує промпти на її основі, а потім звертається до інструментів, щоби втілити власні рішення.
Якщо ціль не досягнута, вона знов починає роздуми й формує нові рішення. Тобто насправді ШІ-агенти самостійні лише у рамках заданої цілі та виданих інструментів, і повстання скайнету чекати поки не треба.
ШІ-агенти мають доволі гарне застосування у покращенні чат-ботів підтримки
Тепер, завдяки агентському ШІ, чат-бот може звернутися до документації, проаналізувати відповідний випадок і сформувати відповідь.
Люди навіть намагаються перекласти на них інші задачі, як бронювання номерів у готелях.
Вайб- кодинг
І звісно ж програмісти, які першими приймають технічні інновації, весь час намагаються застосувати агентів у програмуванні. Повернемося до діалогу з Джарвісом. З наукової фантастики такі розмови прийшли до реальності. Андрей Карпати, колишній директор по штучному інтелекту у «Tesla», вже місяць тому написав:
«Є новий спосіб програмувати, який я назвав «вайб-кодинг» <...> Це можливо тому, що великі мовні моделі (як Cursor Composer чи Sonnet) стали занадто гарними. Я просто розмовляю з Composer’om через Superwhisper [модель для розпізнавання речі], майже не торкаючись клавіатури. <...> Непогано для одноразових проєктів на вихідні».
І один з таких «Одноразових проєктів», можна сказати, злетів.
Гра «Fly Pieter» була, як заявив її автор Пітер Левелс, розроблена за пів години за допомогою ШІ. Гра розрахована на багато користувачів, гравець керує літаком, може збивати дирижаблі чи інші літаки. За місяць гра назбирала більше $50.000. Її творець вже був відомим у соцмережах за те, як він створював швидкі продукти за допомогою ШІ, і заробив на рекламі, що розміщені всередині гри.
Fly Pieter граничить з неповагою до гравців. Гра потворна, а користувачі відмічали, що й дуже повільна і має багато багів. Проте сам факт того, що ШІ зміг створити ММО-гру, вже вражає.
Тож чи значить це, що програмісти стануть не потрібні за рік чи два?
Навряд чи. І тому є фундаментальні причини.
- Головна полягає у тому, що програмний код куди більше читають, ніж пишуть. Більша частина роботи програмістів — це розвиток і зміни у вже чинному коді.
- ШІ, а тим більше — агенти покращують швидкість написання коду, яке займає 10% роботи програмістів, але ніяк не покращують його читання, що займає 90%.
Їх «мозок» — це все ще мовна модель, яка по суті являє собою автоматичну додачу тексту, і не здатна на справжнє розуміння. Як вона зможе зрозуміти складні баги чи проблеми в оптимізації? - І це ще не говорячи про обмежений обсяг контексту, який можуть одночасно підтримувати штучні інтелекти. Достатньо великий проєкт просто вийде за рамки їх памʼяті.
Тож агенти поки що мають дуже обмежену сферу застосування. А створені виключно за допомогою ШІ проєкти навряд чи матимуть довгий життєвий цикл — адже ШІ зможе їх написати, але не зможе підтримувати.
Джерела:
1. https://dev.ua/news/kalichna-shi-hra-zarobyla-vzhe-87k-baksiv-na-reklami-1741866359
2. https://huggingface.co/learn/agents-course/unit1/introduction
Іван Синенко