
Корпорация Google запустила платформу Game Arena, на которой ИИ-модели и агенты могут соревноваться друг с другом в стратегических играх вроде шахмат.
«Игры идеально подходят для оценки искусственного интеллекта, потому что они помогают нам понять, как модели справляются со сложными задачами рассуждения. Многие игры являются аналогом реальных навыков и позволяют проверить способности нейросети в таких областях, как стратегическое планирование, адаптация и память», — говорится в анонсе.
В честь открытия Game Arena компания проведет турнир по шахматам с участием ИИ. Он пройдет в период с 5 по 7 августа и будет транслироваться онлайн. ChatGPT, Gemini, Claude, Grok, Deepseek и Kimi примут участие в мероприятии.
Первые шахматные матчи пройдут между:
- o4 mini и DeepSeek-R1;
- Gemini 2.5 Pro и Claude Opus 4;
- Kimi K2 Instruct и o3;
- Grok 4 и Gemini 2.5 Flash.
Зрители смогут увидеть, как модели обосновывают каждый свой шаг. Такая прозрачность важна для понимания того, действительно ли ИИ думают над проблемами или просто имитируют мыслительную деятельность, считают в Google.
«Мы с нетерпением ждем прогресса, который будет достигнут благодаря этому бенчмарку. Мы добавим все больше игр и задач на Game Arena и ожидаем быстрого улучшения», — Для просмотра ссылки Войди
Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок Для просмотра ссылки Войди
Позже известный шахматист Леви Розман Для просмотра ссылки Войди
- Источник новости
- forklog.com