ICLR 2026PastAgentsGenerative models

Workshop on Multi-Agent Learning and Its Opportunities in the Era of Generative AI

MALGAI

Official website ↗OpenReview venue ↗See all ICLR workshops →✎ Edit this entry

Submission deadline: Feb 11, 2026, 11:59 UTC
OpenReview-synced 2026-02-11 11:59 UTC (as of 2026-06-23) — extensions on OpenReview are applied automatically; verify on the website.
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (57)

Fetched from OpenReview (v2) on 2026-06-10.

AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization
Genghan Zhang, Shaowei Zhu, Anjiang Wei, Zhenyu Song, Allen Nie, Zhen Jia, Nandita Vijaykumar, Yida Wang, Kunle Olukotun · PDF
AffectMind: Proactive Knowledge Grounding with Affective Multimodal Signals for Aligned Marketing Dialogue
Xinyu Wang, Xiaomin Zhao, Yifei Kang, Zhihao Lin, Xiang Luo, Zhang Chengbiao, Jin Cheng, Yixin Wang, Yangyang Zhang, Ernie Tian, Zhiguo Tao, Xiaofei Han, Xiaotong Ding · PDF
Agent-as-a-Coach: Towards Fully Agentic, Stateful, and Tool-Augmented Process Rewards
Ed Li, Junyu Ren, Cat Yan, Kerem Goksel · PDF
AI Organizations Are More Effective but Less Aligned than Individual Agents
Judy Hanwen Shen, Daniel Zhu, Siddarth Srinivasan, Henry Sleight, Lawrence T. Wagner III, Morgan Jane Matthews, Jascha Sohl-Dickstein, Erik Jones · PDF
AI-BAAM: AI-Driven Bank Statement Analytics as Alternative Data for Malaysian MSME Credit Scoring
Chun Chet Ng, Zhen Hao Chu, Jia Yu Lim, Boon Yin Yin, Low Wei Zeng, Jin Khye Tan · PDF
ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering
Zhuowen Yuan, Tao Liu, Yang Yang, Yang Wang, Feng Qi, Kaushik Rangadurai, Bo Li, Shuang Yang · PDF
Assessing Sovereignty in Multi-Agent Collaborations
Eleonore Vissol-Gaudin, janosch haber, Andikan Otung · PDF
Asymptotic Universal Alignment: A New Alignment Framework via Test-Time Scaling
Yang Cai, Weiqiang Zheng · PDF
Beyond Reasoning: RL-Policy Guided LLM Inference for Efficient Strategy in Liar’s Poker
Richard Dewey, János Botyánszki, Ciamac C. Moallemi, Andrew Zheng · PDF
BEYOND SYNTAX: ACTION SEMANTICS LEARNING FOR APP AGENTS
Bohan Tang, Dezhao Luo, Jianheng Liu, Jingxuan Chen, Shaogang Gong, Jianye HAO, Jun Wang, Kun Shao · PDF
Beyond Text-Passing: Shared Cognitive Substrates for Multi-Agent LLM Coordination
Ning Coeva · PDF
Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants
Steven Guanxing Xu, Alejandro Breen, Aayush Sheth, Sudeep Das, Zhucheng Zhan, Hongtai Wei, Charles Wright, Marcus Yearwood · PDF
Can Small Agents Collaborate to Beat a Single Large Language Model?
Agata Żywot, Xinyi Chen, Yifei Yuan, Anders Søgaard, Maarten de Rijke · PDF
CATTLE TRADE: A MULTI-AGENT BENCHMARK FOR LLM BLUFFING, BIDDING, AND NEGOTIATION
Robert Müller · PDF
ComplLLM: Fine-tuning LLMs to Discover Complementary Signals for Decision-making
Ziyang Guo, Yifan Wu, Jason Hartline, Ken Holstein, Jessica Hullman · PDF
CooperBench: Benchmarking Cooperation in Coding Agents
Arpandeep Khatua, Hao Zhu, Peter Tran, Arya Prabhudesai, Frederic Sadrieh, Johann Kaspar Lieberwirth, Xinkai Yu, Yicheng Fu, Michael J Ryan, Jiaxin Pei, Diyi Yang · PDF
CORAL: Cooperative Multi-Agent Orchestration for LLM Adaptation Across Diverse Environments
Nitin Vetcha · PDF
Divide-and-Conquer CoT: RL for Reducing Latency via Parallel Reasoning
Arvind V. Mahankali, Kaiyue Wen, Tengyu Ma · PDF
Do Language Models Deceive? Strategic Behavior and Emergent Deception in Multi-Agent Auctions
Aman Sharma · PDF
Dr. MAS: Stable Reinforcement Learning for Multi-Agent LLM Systems
Lang Feng, Longtao Zheng, Shuo He, Fuxiang Zhang, Bo An · PDF
EconAI: Dynamic Persona Evolution and Memory-Aware Agents inEvolving Economic Environments
Yijin Chen, Ning Lyu, Shengning Lang, Hao Yan, Zhiguo Tao, Xiaotong Ding, Xiaotong Zhu · PDF
Evaluating Cooperation in LLM Social Groups through Elected Leadership
Ryan Faulkner, Anushka Deshpande, David Guzman Piedrahita, Joel Z Leibo, Zhijing Jin · PDF
Evaluating LLM Agents as Human Simulators in Climate Social Dilemmas
Kaiyuan Liu, Xiaoxuan Hou, Jiayi Yuan, Natasha Jaques · PDF
EvoCF: Multi-Agent Collaboration via Agentic Memory-Driven Evolutionary Counterfactual Planning
Haotian Chi, Zeyu Feng, Xingrui Yu, Linbo Luo, Yew-Soon Ong, Ivor Tsang, Hechang Chen, Yi Chang, Haiyan Yin · PDF
Expanding the Capabilities of Reinforcement Learning via Text Feedback
Yuda Song, Lili Chen, Fahim Tajwar, Rémi Munos, Deepak Pathak, Drew Bagnell, Aarti Singh, Andrea Zanette · PDF
Explanations are a Means to an End: Decision Theoretic Explanation Evaluation
Ziyang Guo, Berk Ustun, Jessica Hullman · PDF
Federation over Text
Dixi Yao, Tahseen Rabbani, Tian Li · PDF
Group Distributionally Robust Optimization-Driven RL for LLM Reasoning
Kishan Panaganti, Zhenwen Liang, Wenhao Yu, Haitao Mi, Dong Yu · PDF
GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory
X. Angelo Huang, Pepijn Cobben, Thao Amelia Pham, Terry Jingchen Zhang, Zhijing Jin · PDF
Heterogeneous Low-Bandwidth Pre-Training of LLMs
Yazan Obeidi, Amir Sarfi, Joel Lidin, Paul Janson, Eugene Belilovsky · PDF
Hierarchical Generative Agents for Simulating Sequential Human Behavior
Maria G. Mendoza, Lucas Waldburger, Jin Lee, S. Shankar Sastry · PDF
How Communication Modalities Shape Topology in Generative Multi-Agent Systems
Vinicius Covas · PDF
Interpretable Multi-Agent Debate for Political Opinion Simulation
Aali Azamat uulu, Justin Xue Taing, Alibek Dadajonov, Mayank Goel · PDF
JaxAHT: A JAX-Based Library for Ad Hoc Teamwork
Caroline Wang, Rolando Fernandez, Jiaxun Cui, Johnny Liu, Aditya Madhan, Zhihan Wang, Lingyun Xiao, Di Yang Shi, Arrasy Rahman, Peter Stone · PDF
LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation
Gabriele Cesa, Thomas Hehn, Aleix Torres-Camps, Àlex Batlle Casellas, Jordi Ros-Giralt, Arash Behboodi, Tribhuvanesh Orekondy · PDF
Learning Decentralized LLM Collaboration with Multi-Agent Actor Critic
Shuo Liu, Tianle Chen, Ryan Amiri, Christopher Amato · PDF
Learning the Preferences of a Learning Agent
Karim Abdel Sadek, Mark Bedaywi, Rhys Gould, Stuart Russell · PDF
Let’s Talk, Not Type: An Oral-First Multi-Agent Architecture for Guarani
Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala · PDF
MAGIC: Multi-Agent Generative Intention Coordination
David Huk, Oliver Hamelijnck, Dimitris Demiris, Theodoros Damoulas · PDF
MAPLE: Multi-Agent Prior Learning for Constructing Tree Ensembles
Nguyen Viet Tuan Kiet, Nguyen Ba Thinh, Thanh Trung Huynh, Hieu Pham · PDF
MetroRehearsal: Tool-Guided Multi-Agent Debate for Metro Emergency Planning
Jinlin Li, Xiao Zhou, Yingying Zhang, Xian Wu · PDF
Multi-Agent Consensus Matrix Modeling for Medical Decision-Making: A Role-Specialized LLM Framework for Oncology MDT Consultations
Ziyi Ni, Yiming Yan, Xiaoyi Qu, Yanzhan Chen, Chuang Liu · PDF
Not All Clients Are Equal: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients
Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne Tuytelaars · PDF
Novelty-Gated Experience Sharing for Multi-Agent Reinforcement Learning
Manish Sai Kota, Thomas Fan, Harshita Poojary, Nolawi Teklehaimanot, Aishwarya Balwani · PDF
Reasonably reasoning agents avoid game-theoretic failures in zero-shot, provably
Enoch H. Kang · PDF
RPRA: Predicting an LLM-Judge for Efficient but Performant Inference
Dylan R. Ashley, Gael Le Lan, Changsheng Zhao, Naina Dhingra, Zhipeng Cai, Ernie Chang, Mingchen Zhuge, Yangyang Shi, Vikas Chandra, Jürgen Schmidhuber · PDF
Safe Test-Time Reinforcement learning for Imperfect Information Games
Ondrej Kubicek, Viliam Lisý, Tuomas Sandholm · PDF
Scaling Inference-Time Computation via Opponent Simulation: Enabling Online Strategic Adaptation in Repeated Negotiation
Xiangyu Liu, Di Wang, Zhe Feng, Aranyak Mehta · PDF
Self-Improvement of Language Models by Post-Training on Multi-Agent Debate
Ankur Samanta, Akshayaa Magesh, Runzhe Wu, Ayush Jain, Youliang Yu, Daniel Jiang, Boris Vidolov, Paul Sajda, Yonathan Efroni, Kaveh Hassani · PDF
Self-Questioning Language Models
Lili Chen, Mihir Prabhudesai, Katerina Fragkiadaki, Hao Liu, Deepak Pathak · PDF
SkillTracer: Structural Failure Attribution and Refinement of Agentic Skills in Long-Horizon Web Tasks
Yuyang Li, Yiran Dou, Jie-Jing Shao, Yueming Lyu, Ivor Tsang, Haiyan Yin · PDF
Talk Before You Retrieve: Agent-Led Discussions for Better RAG in Medical QA
XUANZHAO DONG, Wenhui Zhu, Hao Wang, Xiwen Chen, Peijie Qiu, Rui Yin, Yi Su, Yalin Wang · PDF
Team of Thoughts: Efficient Test-time Scaling of Agentic Systems through Orchestrated Tool Calling
Jeffrey T. H. Wong, Zixi Zhang, Junyi Liu, Yiren Zhao · PDF
The Decrypto Benchmark for Multi-Agent Reasoning and Theory of Mind
Andrei Lupu, Timon Willi, Jakob Nicolaus Foerster · PDF
UT-Evolve: AN EVOLUTIONARY AGENT FOR UNIT TEST WRITING
Arshika Lalan, Rajat Ghosh, Debojyoti Dutta · PDF
Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution
Xing Zhang, Yanwei CUI, Guanghui Wang, Qucy Wei Qiu, Ziyuan Li, Fangwei Han, Yajing Huang, Hengzhi Qiu, Bing Zhu, Peiyang He · PDF
Zero-Shot Coordination among LLM Agents
Adrian Hayler, Shashank Reddy Chirra, Andrei Lupu, Johannes Forkel, Bidipta Sarkar, Siheng Feng, Jakob Nicolaus Foerster · PDF

Accepted papers (57)

☆AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization

☆AffectMind: Proactive Knowledge Grounding with Affective Multimodal Signals for Aligned Marketing Dialogue

☆Agent-as-a-Coach: Towards Fully Agentic, Stateful, and Tool-Augmented Process Rewards

☆AI Organizations Are More Effective but Less Aligned than Individual Agents

☆AI-BAAM: AI-Driven Bank Statement Analytics as Alternative Data for Malaysian MSME Credit Scoring

☆ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering

☆Assessing Sovereignty in Multi-Agent Collaborations

☆Asymptotic Universal Alignment: A New Alignment Framework via Test-Time Scaling

☆Beyond Reasoning: RL-Policy Guided LLM Inference for Efficient Strategy in Liar’s Poker

☆BEYOND SYNTAX: ACTION SEMANTICS LEARNING FOR APP AGENTS

☆Beyond Text-Passing: Shared Cognitive Substrates for Multi-Agent LLM Coordination

☆Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

☆Can Small Agents Collaborate to Beat a Single Large Language Model?

☆CATTLE TRADE: A MULTI-AGENT BENCHMARK FOR LLM BLUFFING, BIDDING, AND NEGOTIATION

☆ComplLLM: Fine-tuning LLMs to Discover Complementary Signals for Decision-making

☆CooperBench: Benchmarking Cooperation in Coding Agents

☆CORAL: Cooperative Multi-Agent Orchestration for LLM Adaptation Across Diverse Environments

☆Divide-and-Conquer CoT: RL for Reducing Latency via Parallel Reasoning

☆Do Language Models Deceive? Strategic Behavior and Emergent Deception in Multi-Agent Auctions

☆Dr. MAS: Stable Reinforcement Learning for Multi-Agent LLM Systems

☆EconAI: Dynamic Persona Evolution and Memory-Aware Agents inEvolving Economic Environments

☆Evaluating Cooperation in LLM Social Groups through Elected Leadership

☆Evaluating LLM Agents as Human Simulators in Climate Social Dilemmas

☆EvoCF: Multi-Agent Collaboration via Agentic Memory-Driven Evolutionary Counterfactual Planning

☆Expanding the Capabilities of Reinforcement Learning via Text Feedback

☆Explanations are a Means to an End: Decision Theoretic Explanation Evaluation

☆Federation over Text

☆Group Distributionally Robust Optimization-Driven RL for LLM Reasoning

☆GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory

☆Heterogeneous Low-Bandwidth Pre-Training of LLMs

☆Hierarchical Generative Agents for Simulating Sequential Human Behavior

☆How Communication Modalities Shape Topology in Generative Multi-Agent Systems

☆Interpretable Multi-Agent Debate for Political Opinion Simulation

☆JaxAHT: A JAX-Based Library for Ad Hoc Teamwork

☆LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

☆Learning Decentralized LLM Collaboration with Multi-Agent Actor Critic

☆Learning the Preferences of a Learning Agent

☆Let’s Talk, Not Type: An Oral-First Multi-Agent Architecture for Guarani

☆MAGIC: Multi-Agent Generative Intention Coordination

☆MAPLE: Multi-Agent Prior Learning for Constructing Tree Ensembles

☆MetroRehearsal: Tool-Guided Multi-Agent Debate for Metro Emergency Planning

☆Multi-Agent Consensus Matrix Modeling for Medical Decision-Making: A Role-Specialized LLM Framework for Oncology MDT Consultations

☆Not All Clients Are Equal: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

☆Novelty-Gated Experience Sharing for Multi-Agent Reinforcement Learning

☆Reasonably reasoning agents avoid game-theoretic failures in zero-shot, provably

☆RPRA: Predicting an LLM-Judge for Efficient but Performant Inference

☆Safe Test-Time Reinforcement learning for Imperfect Information Games

☆Scaling Inference-Time Computation via Opponent Simulation: Enabling Online Strategic Adaptation in Repeated Negotiation

☆Self-Improvement of Language Models by Post-Training on Multi-Agent Debate

☆Self-Questioning Language Models

☆SkillTracer: Structural Failure Attribution and Refinement of Agentic Skills in Long-Horizon Web Tasks

☆Talk Before You Retrieve: Agent-Led Discussions for Better RAG in Medical QA

☆Team of Thoughts: Efficient Test-time Scaling of Agentic Systems through Orchestrated Tool Calling

☆The Decrypto Benchmark for Multi-Agent Reasoning and Theory of Mind

☆UT-Evolve: AN EVOLUTIONARY AGENT FOR UNIT TEST WRITING

☆Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

☆Zero-Shot Coordination among LLM Agents

AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization

AffectMind: Proactive Knowledge Grounding with Affective Multimodal Signals for Aligned Marketing Dialogue

Agent-as-a-Coach: Towards Fully Agentic, Stateful, and Tool-Augmented Process Rewards

AI Organizations Are More Effective but Less Aligned than Individual Agents

AI-BAAM: AI-Driven Bank Statement Analytics as Alternative Data for Malaysian MSME Credit Scoring

ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering

Assessing Sovereignty in Multi-Agent Collaborations

Asymptotic Universal Alignment: A New Alignment Framework via Test-Time Scaling

Beyond Reasoning: RL-Policy Guided LLM Inference for Efficient Strategy in Liar’s Poker

BEYOND SYNTAX: ACTION SEMANTICS LEARNING FOR APP AGENTS

Beyond Text-Passing: Shared Cognitive Substrates for Multi-Agent LLM Coordination

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Can Small Agents Collaborate to Beat a Single Large Language Model?

CATTLE TRADE: A MULTI-AGENT BENCHMARK FOR LLM BLUFFING, BIDDING, AND NEGOTIATION

ComplLLM: Fine-tuning LLMs to Discover Complementary Signals for Decision-making

CooperBench: Benchmarking Cooperation in Coding Agents

CORAL: Cooperative Multi-Agent Orchestration for LLM Adaptation Across Diverse Environments

Divide-and-Conquer CoT: RL for Reducing Latency via Parallel Reasoning

Do Language Models Deceive? Strategic Behavior and Emergent Deception in Multi-Agent Auctions

Dr. MAS: Stable Reinforcement Learning for Multi-Agent LLM Systems

EconAI: Dynamic Persona Evolution and Memory-Aware Agents inEvolving Economic Environments

Evaluating Cooperation in LLM Social Groups through Elected Leadership

Evaluating LLM Agents as Human Simulators in Climate Social Dilemmas

EvoCF: Multi-Agent Collaboration via Agentic Memory-Driven Evolutionary Counterfactual Planning

Expanding the Capabilities of Reinforcement Learning via Text Feedback

Explanations are a Means to an End: Decision Theoretic Explanation Evaluation

Federation over Text

Group Distributionally Robust Optimization-Driven RL for LLM Reasoning

GT-HarmBench: Benchmarking AI Safety Risks Through the Lens of Game Theory

Heterogeneous Low-Bandwidth Pre-Training of LLMs

Hierarchical Generative Agents for Simulating Sequential Human Behavior

How Communication Modalities Shape Topology in Generative Multi-Agent Systems

Interpretable Multi-Agent Debate for Political Opinion Simulation

JaxAHT: A JAX-Based Library for Ad Hoc Teamwork

LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

Learning Decentralized LLM Collaboration with Multi-Agent Actor Critic

Learning the Preferences of a Learning Agent

Let’s Talk, Not Type: An Oral-First Multi-Agent Architecture for Guarani

MAGIC: Multi-Agent Generative Intention Coordination

MAPLE: Multi-Agent Prior Learning for Constructing Tree Ensembles

MetroRehearsal: Tool-Guided Multi-Agent Debate for Metro Emergency Planning

Multi-Agent Consensus Matrix Modeling for Medical Decision-Making: A Role-Specialized LLM Framework for Oncology MDT Consultations

Not All Clients Are Equal: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

Novelty-Gated Experience Sharing for Multi-Agent Reinforcement Learning

Reasonably reasoning agents avoid game-theoretic failures in zero-shot, provably

RPRA: Predicting an LLM-Judge for Efficient but Performant Inference

Safe Test-Time Reinforcement learning for Imperfect Information Games

Scaling Inference-Time Computation via Opponent Simulation: Enabling Online Strategic Adaptation in Repeated Negotiation

Self-Improvement of Language Models by Post-Training on Multi-Agent Debate

Self-Questioning Language Models

SkillTracer: Structural Failure Attribution and Refinement of Agentic Skills in Long-Horizon Web Tasks

Talk Before You Retrieve: Agent-Led Discussions for Better RAG in Medical QA

Team of Thoughts: Efficient Test-time Scaling of Agentic Systems through Orchestrated Tool Calling

The Decrypto Benchmark for Multi-Agent Reasoning and Theory of Mind

UT-Evolve: AN EVOLUTIONARY AGENT FOR UNIT TEST WRITING

Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

Zero-Shot Coordination among LLM Agents