За наших часів вчені вже перевершили могутні корпорації в тренуванні великих мовних моделей. Чому штучний інтелект стає все дешевшим і доступнішим? Як стати одним із перших сертифікованих спеціалістів з ШІ-агентів безкоштовно?
Розберемося у сьогоднішній статті.
Не так давно китайська нейромережа DeepSeek приголомшила весь технологічний світ: китайці заявили, що натренували модель, що не гірше за ChatGPT, всього за 10 мільйонів доларів. Сума, мʼяко кажучи, немаленька, але у порівнянні з сотнями мільярдів бюджетів OpenAI — просто мізерна. Навіть якщо китайці применшують ціну в сто разів.
Чи може бути дешеве тренування мовної моделі ШІ?
Проте дешеве тренування — це не міф. Нещодавно вийшла стаття, у якій вчені зі Стенфордського Університету та Університету Вашингтона описали експеримент з тренування великої мовної моделі. Всього лише за 26 хвилин і 50 доларів вони на шістнадцяти графічних процесорах натренували модель, яка може позмагатися в інтелекті з OpenAI o1 — новим «вдумливим» ChatGPT.
Як їм це вдалося?
Автори використали одразу кілька трюків:
- Гарний збір даних.
Вчені зібрали 59 029 питань з математичних олімпіад і вступних тестів топових університетів. - Відбір.
З усіх питань обрали лише 1000 найскладніших, якісних і різноманітних. - Використання вже натренованої моделі Gemini Flash Thinking.
Цю мовну модель застосували для попередньої розмітки рішень, коли нова модель наче «йшла по її кроках».
У кінцевому підсумку вийшла мовна модель, яка за здібностями у математиці й програмуванню доганяє OpenAI o1 і DeepSeek R1. Модель опублікована відкрито на Github.
Якщо підрахувати ціну на оренду комп’ютерного обладнання, то на тренування витратили всього лише близько 50 доларів.
Виявляється, що якщо працювати не важко, а розумно, то можна залишити позаду навіть багатомільйонні компанії.
Розвиток технологій робить їх доступнішими. Прокладати перший шлях через невідоме завжди важко, але чим більше людей проходять ним, тим легшим він стає, надаючи можливість більш ефективним та комфортним способом робити речі.
Безкоштовні ресурси з машинного навчання
Колись написати вебсайт було дуже складною задачею — а зараз існують численні фреймворки й інструменти, які дозволяють швидко зібрати потрібну вам програму.
Так і з машинним навчанням. Вже минулі часи, коли ним могли займатися лише передові вчені. Ніколи в історії штучний інтелект не був таким доступним, і зараз увійти у цей перспективний напрям так зручно, як ніколи. Тому наприкінці цієї статті я пораджу вам два безкоштовних ресурси:
Цей курс — швидке практичне введення до машинного навчання. На 100 вправах ви вивчите основи ML. Курс доступний за посиланням:
https://developers.google.com/machine-learning/crash-course?hl=ua
Найгарячіша тема у ШІ зараз — це агенти: моделі, які можуть не лише генерувати текст, а й самостійно виконувати дії для досягнення мети. І Hugging Face, найбільший сайт для ентузіастів штучного інтелекту, зараз запускає курс по агентах. Наразі він навіть не викладений повністю: поки що для студентів доступний лише перший модуль, розклад наступних на сайті. Курс безкоштовний і наприкінці сертифікується, тож ви можете без проблем доєднатися до нього й опинитися серед перших у світі сертифікованих спеціалістів з ШІ-агентів.
Приєднуйтеся за посиланням. Я вже це зробив.
https://huggingface.co/learn/agents-course/unit0/introduction
Джерела:
1. https://arxiv.org/pdf/2501.19393
Іван Синенко