Проверка популярных моделей от Google, OpenAI, Anthropic и xAI показала, что даже самые развитые системы слабо справляются с длительным прогнозированием исходов матчей.
В рамках эксперимента исследователи загрузили в нейросети статистику команд, информацию о предыдущих матчах и другие детальные данные, а затем поставили перед ними задачу выстроить максимально прибыльные стратегии. На основе этих рекомендаций делались реальные ставки на результаты игр и количество голов. Однако по итогам сезона все модели ушли в минус.
Наилучший результат продемонстрировала модель Claude Opus от Anthropic, уменьшив стартовый банк примерно на 11%. Grok от xAI и Trinity от Arcee полностью проиграли выделенные средства. Gemini от Google сначала вышла в плюс, но затем тоже обнулила капитал. Начальный капитал каждой системы составлял 100 тысяч фунтов.
Авторы эксперимента отмечают, что вокруг ИИ много разговоров как о замене человеку, но такие тесты показывают: в реальных и длительных задачах возможности нейросетей пока сильно ограничены.