Модель штучного інтелекту Gemini 2.5 вперше розв’язала реальну задачу, яка виявилася надскладною для програмістів-людей. Штучний інтелект здобув золоту медаль на міжнародному конкурсі з програмування, що відбувся на початку вересня в Азербайджані.
Як повідомляє видання The Guardian, компанія Google DeepMind стверджує, що здійснила "історичний" прорив у сфері штучного інтелекту, подібний до перемоги комп’ютера Deep Blue над гросмейстером Гаррі Каспаровим у шахи в 1997 році, та перемоги ШІ над чемпіоном з гри Го у 2016 році.
У ході змагання Gemini 2.5 знадобилося менше ніж 30 хвилин, щоб знайти розв'язання складної задачі — організувати найшвидший розподіл рідини через мережу каналів до пов’язаних резервуарів. Жодна з команд студентів-програмістів з Китаю та Японії не змогла впоратися із завданням.
Загалом модель не розв’язала два з 12 поставлених завдань, проте у підсумку посіла друге місце серед 139 найсильніших учасників з усього світу, які вивчають комп’ютерні технології на рівні університету. У Google назвали це історичним моментом на шляху до створення штучного загального інтелекту (Artificial General Intelligence, AGI).
Віцепрезидент DeepMind Куок Ле заявив, що прорив Gemini 2.5 може вплинути на фармацевтику та мікроелектроніку. Все тому, що йдеться про вміння вирішувати завдання, які близькі до реальних наукових і технічних викликів.
"Модель є штучним інтелектом загального призначення, але була спеціально навчена для вирішення дуже складних задач кодування, математики та логіки. Вирішення складних завдань на цих змаганнях вимагає глибокого абстрактного мислення, креативності, здатності синтезувати нові розв'язання проблем, яких ніколи раніше не було, та справжньої іскри винахідливості", — заявили в Google.
Своєю чергою, професор інформатики Каліфорнійського університету в Берклі Стюарт Рассел заявив, що претензії на епохальне значення здаються перебільшеними. Він зауважив, що системи штучного інтелекту вже деякий час добре справляються з програмними завданнями, а прорив у шахах Deep Blue по суті не вплинув на реальний світ прикладного штучного інтелекту.
Втім, він відзначив, що щоб правильно відповісти на питання ICPC [Міжнародного університетського конкурсу з програмування], код насправді має працювати коректно (принаймні на скінченній кількості тестових випадків), тому ці результати можуть демонструвати прогрес у створенні систем кодування на основі штучного інтелекту, достатньо точних для створення високоякісного коду.
Нагадаємо, у серпні OpenAI офіційно випустила свою нову флагманську мовну модель GPT-5, яка вже доступна для користувачів ChatGPT і розробників. Водночас для безплатного користування сервісом передбачено обмеження на кількість запитів, які може зробити користувач.