ICML 2026PastTheory

New Frontiers in Game-Theoretic Learning - NExT-Game

ICML 2026 Workshop

Official website ↗OpenReview venue ↗See all ICML workshops →✎ Edit this entry

Submission deadline: May 13, 2026, 12:00 UTC
OpenReview-synced 2026-05-13 12:00 UTC (as of 2026-06-23) — extensions on OpenReview are applied automatically; verify on the website.
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (64)

Fetched from OpenReview (v2) on 2026-06-10.

A Causal Approach to Game Theory
Aurghya Maiti, Prateek Jain, Elias Bareinboim · PDF
A Minimal Decision Capacity Threshold Prevents Catastrophic Exploitation in Self-Play RL
Arahan Kujur · PDF
Adversarial Training with Large Step Sizes: Implicit Bias and Evolution of Sharpness
Yi Feng, Andrea Paudice, Stratis Skoulakis · PDF
AgentSociety: Incentivizing Agentic Social Intelligence
Aditya Vema Reddy Kesari, Krishna Reddy Kesari · PDF
AlphaZero in Sparsely Rewarded Games: Limits and Auxiliary Supervision
Brent Kong, Tejas Ram, Tony Yue YU · PDF
Attention as Natural Gradient: In-Context Mirror Descent for Opponent Modelling
Alexander Chernyavskiy, Natalia Gusarova, Aleksandra Vatian · PDF
Bayesian Persuasion with a Risk-Conscious Receiver
Yujing Chen · PDF
Bellman-Local Lyapunov Barriers for Exact Stationary Nash Learning in Discounted Perfect-Information Stochastic Games
Manoj Saravanan · PDF
Beyond Scalar Rewards: Dense Feedback for LLM Policy Synthesis in Sequential Social Dilemmas
Victor Gallego · PDF
Beyond Task Success: Evaluating Cooperation in LLM-Based Multi Agent Systems
Ashish Raj Shekhar, Saniya Mulla, Upasana Biswas, Priyanuj Bordoloi, Vivek Gupta · PDF
Bridging Game Theory and Transformer Routing: Mean Field Equilibria for Mixture of Experts
Nevroz Sen · PDF
COMRAD: A Benchmark for Embodied Cooperative Multi-Agent Reinforcement Learning
Khoi H.B. Nguyen, Dimitar Zhivkov Zhekov, Tristan Tomilin · PDF
Designing Training Objectives for Iterative Reasoning Agents: Dense Supervision as an Adaptive Mechanism
Bao N Nguyen Truong, Hoyeon Chang, Alexander Rubinstein, Seong Joon Oh · PDF
Do Prompted Strategic Personas Influence Decision Making in Large Language Models? A Chess-Based Experimental Study
AADIT SHAH, Yash Sinha · PDF
Dynamics of Adversarial Attacks on Large Language Model-Based Search Engines
Xiyang Hu · PDF
EMAgnet: Parameter-Space EMA Regularization for Policy Gradient Self-Play in Large Games
Tristan Maidment, JB Lanier, Chase McDonald, Nathan Tsang, Eugene Vinitsky, Roy Fox, Albert Wang, Wesley N. Kerr · PDF
EngineLab: Evaluating Strategic Generalization Under Rule Shifts
Tianyi Evans Gu, Lucas Yuan · PDF
Equilibrium Selection in Multi-Agent Policy Gradients via Opponent-Aware Basin Entry
Yevhen Shcherbinin, Arina Redina, Maxim Kalpin, Vlad Kochetov · PDF
Failure Modes in AI Retraining Dynamics
Kiarash Banihashem, Natalie Collina, Aleksandrs Slivkins · PDF
Fair Robust Strategic Classification under Decision-Dependent Cost Uncertainty
Sura Alhanouti, Guzin Bayraksan, Parinaz Naghizadeh · PDF
First-Order Efficiency for Probabilistic Value Estimation via A Statistical Viewpoint
Ziqi Liu, Kiljae Lee, Yuan Zhang, Weijing Tang · PDF
From Risk Scoring to Risk Allocation: A Density-Driven Framework for Diverse Monitoring in Multi-Agent Systems
Zhaohui Geoffrey Wang · PDF
GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory
Pepijn Cobben, Xuanqiang Angelo Huang, Thao Amelia Pham, Isabel Dahlgren, Bernhard Schölkopf, Terry Jingchen Zhang, Zhijing Jin · PDF
In-Context Credit Assignment via the Core
Keegan Harris, Siddharth Prasad, Asher Trockman · PDF
Incentive design in sequential statistical protocols
Drew T Nguyen, Alireza Fallah, Michael I. Jordan · PDF
Kantian Equilibrium in the Age of Multi-Agent Systems
Ivan Samoylenko · PDF
Learned Coordination Conventions in Cooperative MARL: Measuring the Translation Gap Between Theory-Informed Roles and Learned Routing
Yoosung Hong · PDF
Learning Bidding Strategies for Karma Economies in Realistic Traffic Settings with Multi-Agent Reinforcement Learning
Anastasia Psarou, Kevin Riehl, Matej Jusup, Anastasios Kouvelas, Michail A. Makridis, Rafal Kucharski · PDF
Learning to Diffuse: Mechanism Design in Social Networks with Information Propagation Costs
Sebastiano Messina, Tatjana Chavdarova · PDF
Learning to Mediate Equilibrium Selection in LLM Games
Miao Liu, Matthew Riemer, Maria Chang, Murray Campbell, Djallel Bouneffouf · PDF
LERA: LLM-Enhanced RAG for Ad Auction in Generative Chatbots
Haoran Sun, Xinrui Song, Xinyu Zhang, Zhaohua Chen, Xu Chu, Zhilin Zhang, Chuan Yu, Jian Xu, Bo Zheng, Xiaotie Deng · PDF
MafiaPersona: A Multi-Agent Adversarial Benchmark for Evaluating Persona Persistence in Large Language Models
Ojaswi Prakash, Dhruv Kumar, Murari Mandal, Mohan Kankanhalli, Yash Sinha · PDF
Markov Chain from Human Feedback
Takuya Koriyama, Tengyuan Liang · PDF
Mechanism Design for Multi-Agent Alpha Discovery: Optimizing Agent Distribution in Heterogeneous LLM Markets
Ajitabh Kumar · PDF
Multi-Agent Reinforcement Learning of Karma Bidding Strategies
Kevin Riehl, Anastasia Psarou, Robert Müller, Fan Wu, Patrick Langer, Robert Jakob, Gabor Hollbeck, Anastasios Kouvelas, Rafal Kucharski, Michail A. Makridis · PDF
Nash Bargaining for Gate-Free Mixture-of-Experts
Abien Fred Agarap, Inigo Miguel Benavides, Sara Ann Venturina · PDF
Neural Algorithmic Reasoning for Nash Equilibrium
Mateusz Kuba Korytkowski, Dobrik Georgiev Georgiev, Davide Buffelli, Pietro Lio · PDF
No-Regret Learning in Bayesian Stackelberg Games with Unknown Follower Types
Matteo Bollini, Francesco Bacchiocchi, Samuel Coutts, Matteo Castiglioni, Alberto Marchesi · PDF
Non-Linear Strategic Classification Made Practical
Jack Geary, Henry Gouk · PDF
Opponent Modeling and Value of Information in Deep Reinforcement Learning for the Iterated Prisoner’s Dilemma
Oleksii Ignatenko, Nazarii Tkach · PDF
Optimism as a Vulnerability: Deceptive Stackelberg Control of UCB Bandit Followers
Şuayp Talha Kocabay, Kerem Yalçın, Talha Rüzgar Akkuş · PDF
PALS: Preference-guided Active Automata Learning for Symbolic Reinforcement Learning in Games
William Peter Fishell, Sam Kouteili, Mark Paul Santolucito, Christian Scaff · PDF
Parametric Open Source Games
Aleksandar Todorov, Jesse ten Napel, Alexander Müller · PDF
Poker Arena: Multi-Axis Profiling of Strategic Reasoning and Memory in LLMs
Pratham Singla, Shivank Garg, VIHAN SINGH · PDF
PoolBench:Benchmarking Large Language Models on Continuous Physical Action Selection in Eight-Ball Pool
Prapti Patra, Dhruv Kumar · PDF
Position: Alignment Needs Rule-Class Routing Before Preference Learning
Zezheng Lin, Jinhao Gan · PDF
Power and Limitations of Aggregation in Compound AI Systems
Nivasini Ananthakrishnan, Meena Jagadeesan · PDF
Preference-Based Distributed Welfare Maximization: A Game-Theoretic Approach
Antoine Bergerault, Anna Maria Maddux, Andreas Schlaginhaufen, Maryam Kamgarpour · PDF
Scaling Laws for Strategic Interactions
Joie Zhang, Danqi Chen, Peter Henderson, Lewis Hammond · PDF
Seeing Through Distractions: Stable Attribution via the Core
Sai Ganesh Nagarajan, Toshinori Yamauchi, Hiroshi Kera · PDF
Self-Play Reinforcement Learning under Imperfect Information in Big 2
Aalok Patwa · PDF
Sequential Minimax Games as Stacked Martingale Optimal Transport
Ethan Chen · PDF
Signaling in Data Markets via Free Samples
Nivasini Ananthakrishnan, Alireza Fallah, Michael I. Jordan · PDF
Stackelberg Mean-Field Games for Adaptive Cancer Therapy
Arash Mehrjou · PDF
Strategic Testing in Games
Angelos Korakitis, Christos Tzamos · PDF
Superhuman AI for Generals.io Using Self-Play Reinforcement Learning
Matej Straka, Martin Schmid · PDF
The Clone Game: Strategic Ecology for Monoculture-Resistant AI Agents
Muhammet Anil Yagiz · PDF
The computational complexity of computing refunds
Stelios Drakontaeidis, Christos Tzamos · PDF
The Cost of Blind Confidence: Opponent Modeling under Imperfect Information
Andrea Menta, Francesca Maifredi, Matteo Papini · PDF
The Price of Over-Delegation: Stackelberg Liability Design for Agentic AI Handoffs
Tomoya Hoshino · PDF
The Symmetry Trap: Parametric Equilibria and the Welfare Cost of Architectural Monoculture
Siddharth Karuturi, Kaustubh S. Bukkapatnam, Soham Batra, Mithil Shah, Tanush Ajay Shastry, Akshath Sharma, Laksh Patel, Aarav Lala, Andrew Bae · PDF
Towards Learning Representations of Policies in Two-Player Zero-Sum Games
Kevin A. Wang, Kevin Yang, Arjun Prakash, Amy Greenwald · PDF
When Agents Lie: Premeditation, Persistence, and Exploitation in Repeated Games
Jerick Shi, Terry Jingchen Zhang, Bernhard Schölkopf, Vincent Conitzer, Zhijing Jin · PDF
Zero Shot Coordination for Sparse Reward Tasks with Diverse Reward Shapings
Keenan Powell, Peihong Yu, Pratap Tokekar · PDF

Accepted papers (64)

☆A Causal Approach to Game Theory

☆A Minimal Decision Capacity Threshold Prevents Catastrophic Exploitation in Self-Play RL

☆Adversarial Training with Large Step Sizes: Implicit Bias and Evolution of Sharpness

☆AgentSociety: Incentivizing Agentic Social Intelligence

☆AlphaZero in Sparsely Rewarded Games: Limits and Auxiliary Supervision

☆Attention as Natural Gradient: In-Context Mirror Descent for Opponent Modelling

☆Bayesian Persuasion with a Risk-Conscious Receiver

☆Bellman-Local Lyapunov Barriers for Exact Stationary Nash Learning in Discounted Perfect-Information Stochastic Games

☆Beyond Scalar Rewards: Dense Feedback for LLM Policy Synthesis in Sequential Social Dilemmas

☆Beyond Task Success: Evaluating Cooperation in LLM-Based Multi Agent Systems

☆Bridging Game Theory and Transformer Routing: Mean Field Equilibria for Mixture of Experts

☆COMRAD: A Benchmark for Embodied Cooperative Multi-Agent Reinforcement Learning

☆Designing Training Objectives for Iterative Reasoning Agents: Dense Supervision as an Adaptive Mechanism

☆Do Prompted Strategic Personas Influence Decision Making in Large Language Models? A Chess-Based Experimental Study

☆Dynamics of Adversarial Attacks on Large Language Model-Based Search Engines

☆EMAgnet: Parameter-Space EMA Regularization for Policy Gradient Self-Play in Large Games

☆EngineLab: Evaluating Strategic Generalization Under Rule Shifts

☆Equilibrium Selection in Multi-Agent Policy Gradients via Opponent-Aware Basin Entry

☆Failure Modes in AI Retraining Dynamics

☆Fair Robust Strategic Classification under Decision-Dependent Cost Uncertainty

☆First-Order Efficiency for Probabilistic Value Estimation via A Statistical Viewpoint

☆From Risk Scoring to Risk Allocation: A Density-Driven Framework for Diverse Monitoring in Multi-Agent Systems

☆GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory

☆In-Context Credit Assignment via the Core

☆Incentive design in sequential statistical protocols

☆Kantian Equilibrium in the Age of Multi-Agent Systems

☆Learned Coordination Conventions in Cooperative MARL: Measuring the Translation Gap Between Theory-Informed Roles and Learned Routing

☆Learning Bidding Strategies for Karma Economies in Realistic Traffic Settings with Multi-Agent Reinforcement Learning

☆Learning to Diffuse: Mechanism Design in Social Networks with Information Propagation Costs

☆Learning to Mediate Equilibrium Selection in LLM Games

☆LERA: LLM-Enhanced RAG for Ad Auction in Generative Chatbots

☆MafiaPersona: A Multi-Agent Adversarial Benchmark for Evaluating Persona Persistence in Large Language Models

☆Markov Chain from Human Feedback

☆Mechanism Design for Multi-Agent Alpha Discovery: Optimizing Agent Distribution in Heterogeneous LLM Markets

☆Multi-Agent Reinforcement Learning of Karma Bidding Strategies

☆Nash Bargaining for Gate-Free Mixture-of-Experts

☆Neural Algorithmic Reasoning for Nash Equilibrium

☆No-Regret Learning in Bayesian Stackelberg Games with Unknown Follower Types

☆Non-Linear Strategic Classification Made Practical

☆Opponent Modeling and Value of Information in Deep Reinforcement Learning for the Iterated Prisoner’s Dilemma

☆Optimism as a Vulnerability: Deceptive Stackelberg Control of UCB Bandit Followers

☆PALS: Preference-guided Active Automata Learning for Symbolic Reinforcement Learning in Games

☆Parametric Open Source Games

☆Poker Arena: Multi-Axis Profiling of Strategic Reasoning and Memory in LLMs

☆PoolBench:Benchmarking Large Language Models on Continuous Physical Action Selection in Eight-Ball Pool

☆Position: Alignment Needs Rule-Class Routing Before Preference Learning

☆Power and Limitations of Aggregation in Compound AI Systems

☆Preference-Based Distributed Welfare Maximization: A Game-Theoretic Approach

☆Scaling Laws for Strategic Interactions

☆Seeing Through Distractions: Stable Attribution via the Core

☆Self-Play Reinforcement Learning under Imperfect Information in Big 2

☆Sequential Minimax Games as Stacked Martingale Optimal Transport

☆Signaling in Data Markets via Free Samples

☆Stackelberg Mean-Field Games for Adaptive Cancer Therapy

☆Strategic Testing in Games

☆Superhuman AI for Generals.io Using Self-Play Reinforcement Learning

☆The Clone Game: Strategic Ecology for Monoculture-Resistant AI Agents

☆The computational complexity of computing refunds

☆The Cost of Blind Confidence: Opponent Modeling under Imperfect Information

☆The Price of Over-Delegation: Stackelberg Liability Design for Agentic AI Handoffs

☆The Symmetry Trap: Parametric Equilibria and the Welfare Cost of Architectural Monoculture

☆Towards Learning Representations of Policies in Two-Player Zero-Sum Games

☆When Agents Lie: Premeditation, Persistence, and Exploitation in Repeated Games

☆Zero Shot Coordination for Sparse Reward Tasks with Diverse Reward Shapings

A Causal Approach to Game Theory

A Minimal Decision Capacity Threshold Prevents Catastrophic Exploitation in Self-Play RL

Adversarial Training with Large Step Sizes: Implicit Bias and Evolution of Sharpness

AgentSociety: Incentivizing Agentic Social Intelligence

AlphaZero in Sparsely Rewarded Games: Limits and Auxiliary Supervision

Attention as Natural Gradient: In-Context Mirror Descent for Opponent Modelling

Bayesian Persuasion with a Risk-Conscious Receiver

Bellman-Local Lyapunov Barriers for Exact Stationary Nash Learning in Discounted Perfect-Information Stochastic Games

Beyond Scalar Rewards: Dense Feedback for LLM Policy Synthesis in Sequential Social Dilemmas

Beyond Task Success: Evaluating Cooperation in LLM-Based Multi Agent Systems

Bridging Game Theory and Transformer Routing: Mean Field Equilibria for Mixture of Experts

COMRAD: A Benchmark for Embodied Cooperative Multi-Agent Reinforcement Learning

Designing Training Objectives for Iterative Reasoning Agents: Dense Supervision as an Adaptive Mechanism

Do Prompted Strategic Personas Influence Decision Making in Large Language Models? A Chess-Based Experimental Study

Dynamics of Adversarial Attacks on Large Language Model-Based Search Engines

EMAgnet: Parameter-Space EMA Regularization for Policy Gradient Self-Play in Large Games

EngineLab: Evaluating Strategic Generalization Under Rule Shifts

Equilibrium Selection in Multi-Agent Policy Gradients via Opponent-Aware Basin Entry

Failure Modes in AI Retraining Dynamics

Fair Robust Strategic Classification under Decision-Dependent Cost Uncertainty

First-Order Efficiency for Probabilistic Value Estimation via A Statistical Viewpoint

From Risk Scoring to Risk Allocation: A Density-Driven Framework for Diverse Monitoring in Multi-Agent Systems

GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory

In-Context Credit Assignment via the Core

Incentive design in sequential statistical protocols

Kantian Equilibrium in the Age of Multi-Agent Systems

Learned Coordination Conventions in Cooperative MARL: Measuring the Translation Gap Between Theory-Informed Roles and Learned Routing

Learning Bidding Strategies for Karma Economies in Realistic Traffic Settings with Multi-Agent Reinforcement Learning

Learning to Diffuse: Mechanism Design in Social Networks with Information Propagation Costs

Learning to Mediate Equilibrium Selection in LLM Games

LERA: LLM-Enhanced RAG for Ad Auction in Generative Chatbots

MafiaPersona: A Multi-Agent Adversarial Benchmark for Evaluating Persona Persistence in Large Language Models

Markov Chain from Human Feedback

Mechanism Design for Multi-Agent Alpha Discovery: Optimizing Agent Distribution in Heterogeneous LLM Markets

Multi-Agent Reinforcement Learning of Karma Bidding Strategies

Nash Bargaining for Gate-Free Mixture-of-Experts

Neural Algorithmic Reasoning for Nash Equilibrium

No-Regret Learning in Bayesian Stackelberg Games with Unknown Follower Types

Non-Linear Strategic Classification Made Practical

Opponent Modeling and Value of Information in Deep Reinforcement Learning for the Iterated Prisoner’s Dilemma

Optimism as a Vulnerability: Deceptive Stackelberg Control of UCB Bandit Followers

PALS: Preference-guided Active Automata Learning for Symbolic Reinforcement Learning in Games

Parametric Open Source Games

Poker Arena: Multi-Axis Profiling of Strategic Reasoning and Memory in LLMs

PoolBench:Benchmarking Large Language Models on Continuous Physical Action Selection in Eight-Ball Pool

Position: Alignment Needs Rule-Class Routing Before Preference Learning

Power and Limitations of Aggregation in Compound AI Systems

Preference-Based Distributed Welfare Maximization: A Game-Theoretic Approach

Scaling Laws for Strategic Interactions

Seeing Through Distractions: Stable Attribution via the Core

Self-Play Reinforcement Learning under Imperfect Information in Big 2

Sequential Minimax Games as Stacked Martingale Optimal Transport

Signaling in Data Markets via Free Samples

Stackelberg Mean-Field Games for Adaptive Cancer Therapy

Strategic Testing in Games

Superhuman AI for Generals.io Using Self-Play Reinforcement Learning

The Clone Game: Strategic Ecology for Monoculture-Resistant AI Agents

The computational complexity of computing refunds

The Cost of Blind Confidence: Opponent Modeling under Imperfect Information

The Price of Over-Delegation: Stackelberg Liability Design for Agentic AI Handoffs

The Symmetry Trap: Parametric Equilibria and the Welfare Cost of Architectural Monoculture

Towards Learning Representations of Policies in Two-Player Zero-Sum Games

When Agents Lie: Premeditation, Persistence, and Exploitation in Repeated Games

Zero Shot Coordination for Sparse Reward Tasks with Diverse Reward Shapings