Только один алгоритм выживет в беспощадном турнире на выбывание.
Компания Kaggle Для просмотра ссылки Войдиили Зарегистрируйся революционную платформу Game Arena — новый способ тестирования искусственного интеллекта через соревнования в стратегических играх. Стартует проект грандиозно: трёхдневным шахматным турниром с участием самых мощных ИИ-моделей современности, включая o3, Gemini 2.5 Pro, Claude Opus 4 и Grok 4.
Турнир пройдет с 5 по 7 августа и обещает стать настоящим зрелищем для любителей как шахмат, так и искусственного интеллекта. Kaggle объединилась с Chess.com и привлекла звёзд шахматного мира: комментарии будет вести легендарный Хикару Накамура на своём стриме, ежедневные обзоры подготовит популярный блогер Леви Розман (GothamChess), а финальный матч прокомментирует сам Магнус Карлсен.
Game Arena представляет собой принципиально новый подход к оценке возможностей ИИ. Вместо традиционных тестов на решение задач, модели будут сражаться друг с другом в реальном времени, демонстрируя навыки стратегического мышления, планирования и адаптации. Игры особенно хороши для тестирования ИИ, поскольку они устойчивы к "переобучению" — даже в шахматах всегда найдутся новые ситуации, способные удивить самые продвинутые алгоритмы.
В шахматном турнире участвуют восемь топовых моделей: Claude Opus 4 от Anthropic, DeepSeek-R1, Gemini 2.5 Pro и Flash от Google, Kimi 2-K2-Instruct от Moonshot AI, o3 и o4-mini от OpenAI, а также Grok 4 от xAI. Турнир пройдет по системе на выбывание, где каждый матч состоит из четырёх партий.
Особенно интересно, что модели будут играть исключительно на основе текстового описания позиции, без доступа к шахматным движкам вроде Stockfish. Если модель предложит незаконный ход, у неё будет три попытки исправиться, иначе партия засчитывается как поражение. Зрители смогут наблюдать не только за ходами, но и за рассуждениями ИИ в режиме реального времени.
Стримы начнутся ежедневно в 21:30 по московскому времени на сайте kaggle.com/game-arena. Приложение Take Take Take позволит следить за каждым ходом и видеть логику рассуждений моделей.
Хотя турнир стартует с шахмат, планы Kaggle гораздо амбициознее. В будущем платформа расширится на множество других игр — от классических настольных до современных видеоигр и симуляций реального мира. Компания сотрудничает с Google DeepMind, создателями знаменитых AlphaGo и AlphaZero, которые выступают научными консультантами проекта.
Важно, что вся платформа останется открытой: игровые среды, код оценки и данные матчей будут доступны всем желающим. Kaggle приглашает другие лаборатории, компании и независимых разработчиков присоединиться к проекту и предложить свои игры для тестирования ИИ.
Результаты турнира сформируют первый рейтинг моделей в шахматах, основанный на системе Эло. Хотя эти очки нельзя будет сравнивать с человеческими рейтингами, они покажут относительную силу различных ИИ-систем. Полные результаты и данные всех партий будут опубликованы 7 августа.
Game Arena знаменует новую эру в оценке искусственного интеллекта, где вместо сухих тестов мы получаем захватывающие соревнования, демонстрирующие реальные возможности машинного разума в динамичной, конкурентной среде.
Компания Kaggle Для просмотра ссылки Войди
Турнир пройдет с 5 по 7 августа и обещает стать настоящим зрелищем для любителей как шахмат, так и искусственного интеллекта. Kaggle объединилась с Chess.com и привлекла звёзд шахматного мира: комментарии будет вести легендарный Хикару Накамура на своём стриме, ежедневные обзоры подготовит популярный блогер Леви Розман (GothamChess), а финальный матч прокомментирует сам Магнус Карлсен.
Game Arena представляет собой принципиально новый подход к оценке возможностей ИИ. Вместо традиционных тестов на решение задач, модели будут сражаться друг с другом в реальном времени, демонстрируя навыки стратегического мышления, планирования и адаптации. Игры особенно хороши для тестирования ИИ, поскольку они устойчивы к "переобучению" — даже в шахматах всегда найдутся новые ситуации, способные удивить самые продвинутые алгоритмы.
В шахматном турнире участвуют восемь топовых моделей: Claude Opus 4 от Anthropic, DeepSeek-R1, Gemini 2.5 Pro и Flash от Google, Kimi 2-K2-Instruct от Moonshot AI, o3 и o4-mini от OpenAI, а также Grok 4 от xAI. Турнир пройдет по системе на выбывание, где каждый матч состоит из четырёх партий.
Особенно интересно, что модели будут играть исключительно на основе текстового описания позиции, без доступа к шахматным движкам вроде Stockfish. Если модель предложит незаконный ход, у неё будет три попытки исправиться, иначе партия засчитывается как поражение. Зрители смогут наблюдать не только за ходами, но и за рассуждениями ИИ в режиме реального времени.
Стримы начнутся ежедневно в 21:30 по московскому времени на сайте kaggle.com/game-arena. Приложение Take Take Take позволит следить за каждым ходом и видеть логику рассуждений моделей.
Хотя турнир стартует с шахмат, планы Kaggle гораздо амбициознее. В будущем платформа расширится на множество других игр — от классических настольных до современных видеоигр и симуляций реального мира. Компания сотрудничает с Google DeepMind, создателями знаменитых AlphaGo и AlphaZero, которые выступают научными консультантами проекта.
Важно, что вся платформа останется открытой: игровые среды, код оценки и данные матчей будут доступны всем желающим. Kaggle приглашает другие лаборатории, компании и независимых разработчиков присоединиться к проекту и предложить свои игры для тестирования ИИ.
Результаты турнира сформируют первый рейтинг моделей в шахматах, основанный на системе Эло. Хотя эти очки нельзя будет сравнивать с человеческими рейтингами, они покажут относительную силу различных ИИ-систем. Полные результаты и данные всех партий будут опубликованы 7 августа.
Game Arena знаменует новую эру в оценке искусственного интеллекта, где вместо сухих тестов мы получаем захватывающие соревнования, демонстрирующие реальные возможности машинного разума в динамичной, конкурентной среде.
- Источник новости
- www.securitylab.ru