Новости Карлсен смотрит, как ИИ борются за шахматную корону — без Stockfish и спасения

NewsMaker

I'm just a script
Премиум
19,536
40
8 Ноя 2022
Только один алгоритм выживет в беспощадном турнире на выбывание.


0gbee32ap9fbgcepfkjcjpn7ezyi0taq.jpg


Компания Kaggle Для просмотра ссылки Войди или Зарегистрируйся революционную платформу Game Arena — новый способ тестирования искусственного интеллекта через соревнования в стратегических играх. Стартует проект грандиозно: трёхдневным шахматным турниром с участием самых мощных ИИ-моделей современности, включая o3, Gemini 2.5 Pro, Claude Opus 4 и Grok 4.

Турнир пройдет с 5 по 7 августа и обещает стать настоящим зрелищем для любителей как шахмат, так и искусственного интеллекта. Kaggle объединилась с Chess.com и привлекла звёзд шахматного мира: комментарии будет вести легендарный Хикару Накамура на своём стриме, ежедневные обзоры подготовит популярный блогер Леви Розман (GothamChess), а финальный матч прокомментирует сам Магнус Карлсен.

Game Arena представляет собой принципиально новый подход к оценке возможностей ИИ. Вместо традиционных тестов на решение задач, модели будут сражаться друг с другом в реальном времени, демонстрируя навыки стратегического мышления, планирования и адаптации. Игры особенно хороши для тестирования ИИ, поскольку они устойчивы к "переобучению" — даже в шахматах всегда найдутся новые ситуации, способные удивить самые продвинутые алгоритмы.

В шахматном турнире участвуют восемь топовых моделей: Claude Opus 4 от Anthropic, DeepSeek-R1, Gemini 2.5 Pro и Flash от Google, Kimi 2-K2-Instruct от Moonshot AI, o3 и o4-mini от OpenAI, а также Grok 4 от xAI. Турнир пройдет по системе на выбывание, где каждый матч состоит из четырёх партий.

Особенно интересно, что модели будут играть исключительно на основе текстового описания позиции, без доступа к шахматным движкам вроде Stockfish. Если модель предложит незаконный ход, у неё будет три попытки исправиться, иначе партия засчитывается как поражение. Зрители смогут наблюдать не только за ходами, но и за рассуждениями ИИ в режиме реального времени.

Стримы начнутся ежедневно в 21:30 по московскому времени на сайте kaggle.com/game-arena. Приложение Take Take Take позволит следить за каждым ходом и видеть логику рассуждений моделей.

Хотя турнир стартует с шахмат, планы Kaggle гораздо амбициознее. В будущем платформа расширится на множество других игр — от классических настольных до современных видеоигр и симуляций реального мира. Компания сотрудничает с Google DeepMind, создателями знаменитых AlphaGo и AlphaZero, которые выступают научными консультантами проекта.

Важно, что вся платформа останется открытой: игровые среды, код оценки и данные матчей будут доступны всем желающим. Kaggle приглашает другие лаборатории, компании и независимых разработчиков присоединиться к проекту и предложить свои игры для тестирования ИИ.

Результаты турнира сформируют первый рейтинг моделей в шахматах, основанный на системе Эло. Хотя эти очки нельзя будет сравнивать с человеческими рейтингами, они покажут относительную силу различных ИИ-систем. Полные результаты и данные всех партий будут опубликованы 7 августа.

Game Arena знаменует новую эру в оценке искусственного интеллекта, где вместо сухих тестов мы получаем захватывающие соревнования, демонстрирующие реальные возможности машинного разума в динамичной, конкурентной среде.
 
Источник новости
www.securitylab.ru

Похожие темы