ICML 2026PastAgentsSafety & alignmentInterpretability

2nd Workshop on Compositional Learning: Safety, Interpretability, and Agents

CompLearn 2026

Official website ↗OpenReview venue ↗See all ICML workshops →✎ Edit this entry

Submission deadline: May 9, 2026, 08:30 UTC
OpenReview-synced 2026-05-09 08:30 UTC (as of 2026-06-24) — extensions on OpenReview are applied automatically; verify on the website.
Notification: May 22, 2026
Submission portal: OpenReview
Notes: Deadline added from the workshop website.

Accepted papers (135)

Fetched from OpenReview (v2) on 2026-06-10.

A Compositional Calculus for Semantic Synergy in Language Model Embeddings
Abel Jansma · PDF
A mathematical theory of balancing relational generalization and memorization
Luke Cheng, Samuel Lippl
A Theory of Atomic Features and Four Testable Predictions
Kenny Peng, Jon Kleinberg, Nikhil Garg
Actionable Interpretability Must Be Defined in Terms of Symmetries: A Compositional Probabilistic Approach
Pietro Barbiero, Mateo Espinosa Zarlenga, Francesco Giannini, Alberto Termine, Filippo Bonchi, Mateja Jamnik, Giuseppe Marra
Adaptive Minds: Empowering Agents with LoRA-as-Tools
Pavan C Shekar, Aswanth Krishnan · PDF
Adaptive Recurrence as Algorithmic Time for Length Generalization in Addition
Imran Ibrahimli, Stefan Wermter, Jae Hee Lee · PDF
Additive Relational Bindings in Transformers: What Sparse Autoencoders Miss
Sebastian Hönig, Kushal Jain, Su Ji Park, Bart Bussmann, Patrick Leask
Ask, Don’t Judge: Binary Questions for Interpretable LLM Evaluation and Self-Improvement
Sangwoo Cho, Kushal Chawla, Pengshan Cai, Zefang Liu, Chenyang Zhu, Shi-Xiong Zhang, Sambit Sahu
Atomic Chess Reveals Compositional Reasoning Failures in LLMs
Ryan Co, Karthik Reddy Konuganti
Attractor Inversion: A Geometric Account of Adversarial Manipulation in Human Decision-Making
Leo Lorence George, Anushri Iyer, Abhishek Bakshi, Pavan Kulkarni
Beyond Safe Data: Pretraining-Stage Alignment with Regular Safety Reflection
Jinhan Li, Kexian Tang, Yihan Xu, Zhuorui Ye, Kaifeng Lyu
Biregular Sparse Initialization Shifts the Rate and Shape of Compositional Escape in Sequential Arithmetic Curricula
Clément Castellon, Arindam Biswas
CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents
Hanna Foerster, Tom Blanchard, Kristina Nikolić, Ilia Shumailov, Cheng Zhang, Robert D. Mullins, Nicolas Papernot, Florian Tramèr, Yiren Zhao
Causal Cartographer: From Mapping to Reasoning Over Counterfactual Worlds
Gael Gendron, Joze M. Rozanec, Michael J. Witbrock, Gillian Dobbie
Causal-JEPA: Learning World Models through Object-Level Latent Masking
Heejeong Nam, Quentin Le Lidec, Lucas Maes, Yann LeCun, Randall Balestriero
CB-Orchestrator: Adaptive Workflow Optimization for LLM Agents via Contextual Bandits
Jiahang Sun, Zhiwei Shang, Zhipiao Liu, Hongwei Yang, XIE GUOQING, Shuang Qiu, Zhongxiang Dai
Chain-of-Thought Gradient Descent
Hong-Yu Chen, Venkat Sripad Ganti, Jerry Yao-Chieh Hu, Hude Liu, Han Liu
Circuit Modularity Predicts Compositional Generalization: Theory and Evidence from Transformers
Kaustubh S. Bukkapatnam, Siddharth Karuturi
Circuit Oracle: Automating Attribution Graph Analysis via Natural-Language Queries
Hong Kiat Tan, Shariar Kabir, Swastik Agrawal, Sai V R Chereddy, Sriram Balasubramanian
ClinSeekAgent: Automating Multi-modal Evidence Seeking for Agentic Clinical Reasoning
Juncheng Wu, Letian Zhang, Yuhan Wang, Haoqin Tu, Hardy Chen, Zijun Wang, Cihang Xie, Yuyin Zhou · PDF
CLIP Models Generalize Less Than Compositional Benchmarks Suggest
Shuman Peng, Arnas Uselis, Darina Koishigarina, Martin Ester, Seong Joon Oh
CMAG: Concept-Scaffolded Retrieval for Marketplace Avatar Generation
Rajeev Goel, Jason Ding, Phani Harish Wajjala, Pavan K. Turaga, Tejaswi Gowda, Krishna C. Garikipati
Code-enabled language models can outperform reasoning models on diverse tasks
Cedegao E. Zhang, Cédric Colas, Gabriel Poesia, Joshua B. Tenenbaum, Jacob Andreas
COGITAO: A Procedural and Object-Centric Framework to Evaluate Compositional and Systematic Generalization
Yassine Taoudi-Benchekroun, Klim Troyan, Pascal Josef Sager, Stefan Gerber, Lukas Tuggener, Thilo Stadelmann, Benjamin F Grewe · PDF
CompFlow: Composing Velocity Fields for Multi-Condition Generation
Luca Miglior, Vincenzo Gervasi, Davide Bacciu · PDF
Compositional Adversarial Training for Robust Visual Watermarking
Anirudh Satheesh, Michael-Andrei Panaitescu-Liess, Andrew Ye Xu, Georgios Milis, Heng Huang, Zikui Cai, Furong Huang
Compositional Agentic Formulation Search for Open-Vocabulary Audio-Visual Event Localization
Beomgwon Jo, Sunchan Park, Kyeongbo Kong
Compositional by Design: Background-Invariant Representations via Linear Additivity in VLMs
Youssef Zaazou, Mark Thomas
Compositional Consistency-Guided Decoding for Three-Way Logical Question Answering
Tianyi Huang, Ming Ren Hou, Jiaheng Su, Yutong Zhang, Ziling Zhang
Compositional Evolutionary Probing of LLM Safety Alignment
Ashish Baghel
Compositional Failure in Audio-Visual LLMs: Late-Layer Prior Dominance Under Cross-modal Conflict
Adarsh Sudheer, David Li, Omar El-Banna, Ishaan Kodarapu, Arjun Bahuguna, Vasu Sharma · PDF
Compositional Investigation: Why Reasoning Enables Tool-Using Agents to Fix What They Diagnose
Dhatri C, Tadisetty Sai Yashwanth
Compositional Neuro-Symbolic Reasoning
Anugyan Das, Omkar Ghugarkar, Vishvesh G Bhat, Asad Aali
Compositional Self-Improvement
Changho Shin, Daiwei Chen, John Cooper, Brenden Lake, Frederic Sala, Ramya Korlakai Vinayak · PDF
Compositional Skill Acquisition in Agentic Pipelines via Reinforcement Learning and Knowledge Distillation
Akshaykumar, Tadisetty Sai Yashwanth
Compositional Skill Chaining and Policy Blending for Hard Exploration in the BRIO Labyrinth Game
Young-Min Kim, Bo-Yeong Kang
Compositional Skill Execution in LLM Multi-Agent Systems: A Comparative Study of Collaboration Architectures for Long-Horizon Tasks
Mihyang Kim · PDF
Compositional Underdetermination in AI Agents: When Behavioral Success Is Not Compositional Evidence
Aviral Srivastava, Sourav Panda
Concepts in Motion: Temporal Concept Bottleneck Model for Interpretable Video Classification
Patrick Knab, Sascha Marton, Philipp Johannes Schubert, Drago Andres Guggiana Nilo, Christian Bartelt · PDF
Count Me If You Can: Geometric Failure Modes in Language Model Counting
Nicholas Bai, Ayushi Mehrotra
CUA-Skill: Developing Computer Using Agents with a Skill Framework
Tianyi Chen, Yinheng Li, Michael Solodko, Sen Wang, Nan Jiang, Junheng Hao, Tingyuan Cui, Jongwoo Ko, Sara Abdali, Suzhen Zheng, Pashmina Cameron, Justin Wagle, Kazuhito Koishida · PDF
Dimensionality Controls When Modularity Helps in Continual Learning
Kathrin Korte, Christian Medeiros Adriano, Joachim Winther Pedersen, Eleni Nisioti, Sebastian Risi
Direction-Conditioned Policies via Compositional Subgoal Scoring for Online Goal-Conditioned Reinforcement Learning
Swaminathan S K, Damiya Gondha, Theyanesh Eswaramoorthy Rajahkrishnan, Aritra Hazra
Dissociating Decodability and Causal Use in Bracket-Sequence Transformers
Aryan Sharma, Cutter Dawes, Shivam Raval
Do Thinking Tokens Help with Safety?
Narutatsu Ri, Abhishek Panigrahi, Sanjeev Arora
Don't Trust Stubborn Neighbors: A Security Framework for Agentic Networks
Samira Abedini, Sina Mavali, Lea Schönherr, Martin Pawelczyk, Rebekka Burkholz
DPMI: A Principled Index for Neural Polysemanticity via Dirichlet Process Mixture Modeling
Manan Gupta, Dhruv Kumar
Dual-Resolution Recursive Energy: Certified Contract–Expand Inference for Sequential Decision Making
Haozhou Gao, ZENG JIARUI, Wendi Ren, Yanwen Liu, Shuang Li
Emergent Compositional Skills in Mixture-of-Experts VLAs
Shlok Shah, Rhiaan Jhaveri, Tharun Kumar Tiruppali Kalidoss, Chirayu Nimonkar, Ishaan Javali, Dhruv Shah
Emergent Social Intelligence Risks in Generative Multi-Agent Systems
Yue Huang, Yu Jiang, Wenjie Wang, Haomin Zhuang, Xiaonan Luo, Yuchen Ma, Zhangchen Xu, Zichen Chen, Nuno Moniz, Zinan Lin, Pin-Yu Chen, Nitesh V. Chawla, Nouha Dziri, Huan Sun, Xiangliang Zhang · PDF
Entropy-Aware GUI Grounding: From Failure Analysis to Improved Localization
Chengxin Liu, Moon Ye-Bin, Tae-Hyun Oh
Evolution of Cooperation in LLM Societies : A Multi-Lingual Examination
Kriti Mahajan
Evolutionary System Prompt Learning for Reinforcement Learning in LLMs
Lunjun Zhang, Ryan Chen, Bradly C. Stadie
Explaining is Harder Than Predicting Alone: Evaluating Concept-based Explanations of MLLMs as ICL Visual Classifiers
Carmen Quiles Ramírez, Leticia Lorena Rodriguez, Nicolas Martorell, Natalia Díaz-Rodríguez
Fixed-Point Reasoning: Stable and Adaptive Deep Looped Models
Sajad Movahedi, Shlomo Libo Feigin, Vera Milovanović, Alexander Theus, Thomas Hofmann, Valentina Boeva, T. Konstantin Rusch, Antonio Orvieto
FormalImG: Evaluating Structural Compositional Generalization for T2I Models
Hong-Jie You, Jie-Jing Shao, Xiao-Wen Yang, Zhi-Fan Wu, Lin-Han Jia, Lan-Zhe Guo, Yu-Feng Li · PDF
From Composition to Compositionality: Discovering Reusable Structure in Polyphonic Music Embeddings
Zhijin Guo, Richard Freedman, Martha Lewis
From Mechanistic to Compositional Interpretability
Ward Gauderis, Thomas Dooms, Steven T. Homer, Kola Ayonrinde, Geraint A. Wiggins
From Numbers to Narratives: Goal-Oriented Summarization of Machine Learning Model Differences
Nam Hyeon-Woo, Tae-Hyun Oh, Zeynep Akata, Stephan Alaniz
From Self-Preservation to Peer-Preservation: A Staged Framing of Preservation-Oriented Misalignment in Frontier Models
Rundong Yang · PDF
Fusion is the New Mutation: Bandit-Guided Evolution on Workflow Graphs
Zhiwei Shang, Jiahang Sun, Mingrong Gong, Mingze Kong, Zikun Qu, Pingchen Lu, Junhao Dong, Zhipiao Liu, Hongwei Yang, XIE GUOQING, Yao Shu, Zhongxiang Dai
Gating Enables Curvature: A Geometric Expressivity Gap in Attention
Satwik Bathula, Anand Joshi
Grad Detect: Gradient-Based Hallucination Detection in LLMs
Anand Kamat, Daniel Blake, Brent M. Werness · PDF
Hidden in Plain Sight: Benchmarking Agent Safety Against Decomposition Attacks with DeCompBench
Vikhyath Kothamasu, Virginia Smith, Chhavi Yadav
HINT: Task Demonstrations for Hierarchical Inference in Abstract Reasoning
Nirlipta Pande, Georg Niess, Julian Gutheil, Roman Kern, Robert Legenstein, Robert Peharz
How does RL Post-training Induce Skill Composition? A Case Study on Countdown
Simon Park, Simran Kaur, Sanjeev Arora
How Many Features Can a Language Model Store Under the Linear Representation Hypothesis?
Nikhil Garg, Jon Kleinberg, Kenny Peng
IGG: A Benchmark for Interactive GUI Grounding under Visibility Constraints
Kyeong Seon Kim, Jiyeon Son, Tae-Hyun Oh
Improving the Compositionality of Triplet-Based Neural Algorithmic Reasoners
Stjepan Požgaj, Dobrik Georgiev Georgiev, Marin Šilić, Goran Delac, Klemo Vladimir
In-Context Learning Amplifies a Latent Compositional Circuit
Melissa Wessel
Installing and Obstructing Heuristics: Learning Dynamics in Nim
Leo Villani, Sultan Daniels, Ijin Yu, Anant Sahai
Introspective Coupling: LMs Explain Themselves Better Than Training Targets
Zifan Carl Guo, Laura Ruis, Jacob Andreas, Belinda Z. Li
Irreducible Supervision Enables Compositional Generalization in Post-Training
Ellen Ma, Nikhil Anand
Language Elicits Emergent Symbol Processing in Vision Foundation Models
Jung-Chun Liu, Naihao Deng, Joyce Chai
Large Language Models Can Follow Instructions, But Not Many at Once: Phase Transitions in Compositional Constraint Satisfaction
Mariya I. Vasileva
Learning Compositional Tasks via Trigger Compositions: Using Scratchpads as Pre-Answer Workspaces
Heejin Choi
Learning to Theorize the World from Observation
Doojin Baek, Gyubin Lee, Junyeob Baek, Hosung Lee, Sungjin Ahn
Learning What’s Missing: Failure-Driven Skill Discovery via Predicate Bridges
Yanwen Liu, Wendi Ren, Haozhou Gao, Shuang Li
LGPro: Language-Guided Prototype Discovery for Compositional Zero-Shot Learning
Anna-Alina Bondarets, Taras Rumezhak, Volodymyr Karpiv · PDF
Logit Grafting: The Post-Training Delta is Sparse, Portable, and Powerful
Apurv Verma, Binh-Nguyen Nguyen, Hai Phan, Lingxiao Wang
MAVEN: Improving Generalization in Agentic Tool Calling
Omkar Ghugarkar, Vishvesh G Bhat, Muhammad Ahmed Mohsin, Asad Aali
Meaning Representations as Variational Quantum Circuits
Tilen Gaetano Limbäck-Stokin, Tanishka Birdavade, Kin Ian Lo, Mehrnoosh Sadrzadeh
Measuring the Limits of Continual Learning for LLMs
Nimit Kalra, Narutatsu Ri, Zerzar Bukhari, Ang Li, Sanae Lotfi, Liam H Fowl, Micah Goldblum
Mitigating Over-Personalization in Language Models via Structured Memory
Hakeem Hannoon, Andrew Zhao, Mihir Narayan, Sharvin Goyal, Ivaxi Sheth
MKEvolve: A Modular Multi-Agent Framework for Kernel Code Generation
Jason Yoo, Rajarshi Saha, Tao Yu, Shaowei Zhu, Wei Tang, Youngsuk Park
MoTVLA: A Vision-Language-Action Model with Unified Fast-Slow Reasoning
Wenhui Huang, Changhe Chen, Han Qi, Chen Lv, Yilun Du, Heng Yang
Multi-Agent Systems are Mixtures of Experts: Who Becomes an Influencer?
Franka Bause, Jonas Niederle, Martin Pawelczyk, Rebekka Burkholz
MultiVulnBench: A Large-Scale Benchmark for Count Bias in LLM-Based Multi-Vulnerability Detection
Manan Gupta, Chinmay Pushkar, Sanchit Kabra, Dhruv Kumar, Jagat Sesh Challa
Noise-Tolerant Verification of Compositional Boolean Recovery
Pranay Jha
Not Just RLHF: Why Alignment Alone Won't Fix Multi-Agent Sycophancy
Adarsh Kumarappan, Ananya Mujoo
Nouns, Not Modifiers: OpenVLA Parses Objects but Fails at Spatial Composition
Jin Yoo
On the Role of Learned Alignment Matrices in LatentMAS
Spursh Deshpande, Wenhao Lu
Operads for compositional reasoning in LLMs
Nathaniel Bottman, Kyle Richardson
Playing Devil’s Advocate: Off-the-Shelf Persona Vectors Rival Targeted Steering for Sycophancy
Ishaan Kelkar, Nebras Alam, Vikram Kakaria, Madhur Panwar, Vasu Sharma, Maheep Chaudhary
Policy Transfer for Hierarchical Goal-Conditioned Reinforcement Learning
Usman Islam, Zhixun Chen, Stefanos Leonardos, Matteo Leonetti, Yali Du
Preference Instability in Reward Models: Detection and Mitigation via Sparse Autoencoders
Shunchang Liu, Xin Chen, Belen Martin Urcelay, Francesco Croce
Reasoning as State Transition: A Representational Analysis of Reasoning Evolution in Large Language Models
Siyuan Zhang, Jialian Li, Yichi Zhang, Xiao Yang, Yinpeng Dong, Hang Su
Reasoning Phases Are Continuous, Not Discrete: Evidence from Switching Linear Dynamical Systems Applied to Chain-of-Thought Residual Streams
Manan Gupta, Dhruv Kumar
Reasoning with Neologisms: Can Soft Tokens Learn Composable Reasoning Skills Without Forgetting?
Antonin Berthon, Mihaela van der Schaar
Reflection Anchors for Interpretable Compositional Visual Reasoning in Multimodal Reinforcement Learning
Xuan Gong, Hanbo Huang, Hao Zheng, Yiran Zhang, Wenbin Dai, Weishu Zhao, Shiyu Liang · PDF
Retrieval is Enough: Training-Free Interpretability with a Tool-Using Agent
Sriram Balasubramanian, Soheil Feizi
RL Post-Training Builds Compositional Reasoning Strategies
Azwar Abdulsalam, Nishil Patel, Andrew M Saxe
Safety Cost of Steering Vectors Is Separable and Reducible
Yuxiao Li, Gjergji Kasneci
Sample Complexity of Scientific Discovery: PAC Learnability of Compositional Function Trees
Şuayp Talha Kocabay, Talha Rüzgar Akkuş, Kerem Yalçın
Separable Representations of Task Complexity and Deliberation in Reasoning Language Models.
Xuan-Quang Nguyen, Hieu M. Vu, Dung Viet Nguyen, Hai Tuan Luu, Linh Duy Tran, Tan Minh Nguyen
Sparse Autoencoders Find Causal, Lineage-Specific Context Features in Chromatin Foundation Models
Nicole Ching, Ayushi Mehrotra
Sparse Memory Finetuning as a Low-Forgetting Alternative to LoRA and Full Finetuning
Prakhar Gupta, Garv Shah, Satyam Goyal, Anirudh Kanchi
Spatial Compositional Counterfactuals in Concept Bottleneck Models
Ran Eisenberg, Ofir Lindenbaum · PDF
Spatially Stable GUI Grounding via Zoom Consistency Loss
Moon Ye-Bin, Jiyeon Son, Tae-Hyun Oh
Stop Probing, Start Coding: Why Linear Probes and Sparse Autoencoders Fail at Compositional Generalisation
Vitória Barin-Pacela, Shruti Joshi, Isabela Camacho, Simon Lacoste-Julien, David Klindt
Struct-to-Reason: Enhancing Video Understanding of Vision-Language Models by Decoupling Perception and Reasoning via Structured Summary
Hengyu Liu, Chenxin Li, Wenbo Hu, Zhiqin Yang, Yuxin Chen, Ying Shan, Brandon Y. Feng
Structure over Pixels: Learning Variable-Length Visual Programs
Piotr Wyrwinski, Kacper Dobek, Krzysztof Krawiec
Successor Re-grounding Audits Compositional Rollout Mismatch in Neuro-Symbolic Search
Miroslav Lžičař
TAME the BALROG: Task-Adaptive Modular Evolution framework for Game Agents
Ola Aleksandra Pasieka, Dominika Woszczyk, Antoine Cully, Borja G. León
The Compositional Generalization Gap in Named Entity Recognition: Static Benchmarks Overestimate Transferable Performance
Varun Kotte
The Spurious Composition Problem: Conditional Independence as a Necessary and Sufficient Condition for Systematic Generalization
Siddharth Karuturi, Kaustubh S. Bukkapatnam, Soham Batra, Laksh Patel, Tanush Ajay Shastry
The Theory and Practice of MAP Inference over Non-Convex Constraints
Leander Kurscheidt, Gabriele Masina, Roberto Sebastiani, Antonio Vergari
THEIA: Learning Complete Kleene Three-Valued Logic in a Pure-Neural Modular Architecture
Augustus Haoyang Li
Toward Compositional Latent Action Interfaces for Generalizable Agents
Heejeong Nam, Chandradithya S Jonnalagadda, Harshit Aggarwal, Eric Xu
Tracking Training Phases in Compositional Learning with Task-Agnostic Measures
Niclas Dern, Selma Mazioud, Jakob Heiss, Avrajit Ghosh, Curtis James McDonald, Gabriel Clara, Bin Yu
Universality, Composition Generalization, and Algorithm Emulation All In-Context
Jerry Yao-Chieh Hu, Hong-Yu Chen, Po-Chiao Lin, Maojiang Su, Han Liu
Unsafe Only in Combination: Interaction-Barrier Shielding for Tool-Using LLM Agents
Rishabh Bhattacharya
Unsupervised Decomposition with Recombination-Consistent Diffusion Models
Archer Wang, Emile Timothy Anand, Yilun Du, Marin Soljacic
VASAE: Naming SAE Dictionary Directions with Vocabulary-Aligned Anchoring
Kairui Zhang, Ziwen Yu, Zahraa S. Abdallah, Martha Lewis
Visual Counterfactual Explanations with Compositional Generative Models
Daniil Kirilenko, Dario Fenoglio, Martin Gjoreski, Marc Langheinrich
What Do Latent Agents Actually Represent? Interpreting Hidden-State Communication in Multi-Agent Systems
Wenhao Lu, Spursh Deshpande
What makes the whole? Probing Attribute-Level Compositionality in LLM Judges
Savita Bhat, Vasudeva Varma
When Do Diffusion Models learn to Generate Multiple Objects?
Yujin Jeong, Arnas Uselis, Iro Laina, Seong Joon Oh, Anna Rohrbach
When Do Multi-Agent Systems Outperform? Analysing the Learning Efficiency of Agentic Systems
Junwei Su, Chuan Wu
When Does Composition Compose? A PAC-Theoretic Framework for Compositional Faithfulness, Safety Certificates, and Training Dynamics
Siddharth Karuturi, Kaustubh S. Bukkapatnam, Tanush Ajay Shastry
When Does Disentanglement Enable Compositional Generalization? A Transfer Bound and Its Empirical Validation
Rishi Ashish Shah, Shivaay Dhondiyal, Sarthak Pandey
When to Re-Plan: Subgoal Persistence in Hierarchical Latent Reasoning
Ayushi Chadha
Where’s the Plan? Locating Latent Planning in Language Models with Lightweight Mechanistic Interventions
Nicole H. Ma, Nick Rui · PDF
Which Way Did It Move? Diagnosing and Overcoming Directional Motion Blindness in Video LLMs
Jongseo Lee, Hyuntak Lee, Sunghun Kim, Sooa Kim, Jihoon Chung, Jinwoo Choi
Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw
Zijun Wang, Haoqin Tu, Letian Zhang, Hardy Chen, Juncheng Wu, Xiangyan Liu, Zhenlong Yuan, Tianyu Pang, Michael Qizhe Shieh, Fengze Liu, Zeyu Zheng, Huaxiu Yao, Yuyin Zhou, Cihang Xie

Accepted papers (135)

☆A Compositional Calculus for Semantic Synergy in Language Model Embeddings

☆A mathematical theory of balancing relational generalization and memorization

☆A Theory of Atomic Features and Four Testable Predictions

☆Actionable Interpretability Must Be Defined in Terms of Symmetries: A Compositional Probabilistic Approach

☆Adaptive Minds: Empowering Agents with LoRA-as-Tools

☆Adaptive Recurrence as Algorithmic Time for Length Generalization in Addition

☆Additive Relational Bindings in Transformers: What Sparse Autoencoders Miss

☆Ask, Don’t Judge: Binary Questions for Interpretable LLM Evaluation and Self-Improvement

☆Atomic Chess Reveals Compositional Reasoning Failures in LLMs

☆Attractor Inversion: A Geometric Account of Adversarial Manipulation in Human Decision-Making

☆Beyond Safe Data: Pretraining-Stage Alignment with Regular Safety Reflection

☆Biregular Sparse Initialization Shifts the Rate and Shape of Compositional Escape in Sequential Arithmetic Curricula

☆CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents

☆Causal Cartographer: From Mapping to Reasoning Over Counterfactual Worlds

☆Causal-JEPA: Learning World Models through Object-Level Latent Masking

☆CB-Orchestrator: Adaptive Workflow Optimization for LLM Agents via Contextual Bandits

☆Chain-of-Thought Gradient Descent

☆Circuit Modularity Predicts Compositional Generalization: Theory and Evidence from Transformers

☆Circuit Oracle: Automating Attribution Graph Analysis via Natural-Language Queries

☆ClinSeekAgent: Automating Multi-modal Evidence Seeking for Agentic Clinical Reasoning

☆CLIP Models Generalize Less Than Compositional Benchmarks Suggest

☆CMAG: Concept-Scaffolded Retrieval for Marketplace Avatar Generation

☆Code-enabled language models can outperform reasoning models on diverse tasks

☆COGITAO: A Procedural and Object-Centric Framework to Evaluate Compositional and Systematic Generalization

☆CompFlow: Composing Velocity Fields for Multi-Condition Generation

☆Compositional Adversarial Training for Robust Visual Watermarking

☆Compositional Agentic Formulation Search for Open-Vocabulary Audio-Visual Event Localization

☆Compositional by Design: Background-Invariant Representations via Linear Additivity in VLMs

☆Compositional Consistency-Guided Decoding for Three-Way Logical Question Answering

☆Compositional Evolutionary Probing of LLM Safety Alignment

☆Compositional Failure in Audio-Visual LLMs: Late-Layer Prior Dominance Under Cross-modal Conflict

☆Compositional Investigation: Why Reasoning Enables Tool-Using Agents to Fix What They Diagnose

☆Compositional Neuro-Symbolic Reasoning

☆Compositional Self-Improvement

☆Compositional Skill Acquisition in Agentic Pipelines via Reinforcement Learning and Knowledge Distillation

☆Compositional Skill Chaining and Policy Blending for Hard Exploration in the BRIO Labyrinth Game

☆Compositional Skill Execution in LLM Multi-Agent Systems: A Comparative Study of Collaboration Architectures for Long-Horizon Tasks

☆Compositional Underdetermination in AI Agents: When Behavioral Success Is Not Compositional Evidence

☆Concepts in Motion: Temporal Concept Bottleneck Model for Interpretable Video Classification

☆Count Me If You Can: Geometric Failure Modes in Language Model Counting

☆CUA-Skill: Developing Computer Using Agents with a Skill Framework

☆Dimensionality Controls When Modularity Helps in Continual Learning

☆Direction-Conditioned Policies via Compositional Subgoal Scoring for Online Goal-Conditioned Reinforcement Learning

☆Dissociating Decodability and Causal Use in Bracket-Sequence Transformers

☆Do Thinking Tokens Help with Safety?

☆Don't Trust Stubborn Neighbors: A Security Framework for Agentic Networks

☆DPMI: A Principled Index for Neural Polysemanticity via Dirichlet Process Mixture Modeling

☆Dual-Resolution Recursive Energy: Certified Contract–Expand Inference for Sequential Decision Making

☆Emergent Compositional Skills in Mixture-of-Experts VLAs

☆Emergent Social Intelligence Risks in Generative Multi-Agent Systems

☆Entropy-Aware GUI Grounding: From Failure Analysis to Improved Localization

☆Evolution of Cooperation in LLM Societies : A Multi-Lingual Examination

☆Evolutionary System Prompt Learning for Reinforcement Learning in LLMs

☆Explaining is Harder Than Predicting Alone: Evaluating Concept-based Explanations of MLLMs as ICL Visual Classifiers

☆Fixed-Point Reasoning: Stable and Adaptive Deep Looped Models

☆FormalImG: Evaluating Structural Compositional Generalization for T2I Models

☆From Composition to Compositionality: Discovering Reusable Structure in Polyphonic Music Embeddings

☆From Mechanistic to Compositional Interpretability

☆From Numbers to Narratives: Goal-Oriented Summarization of Machine Learning Model Differences

☆From Self-Preservation to Peer-Preservation: A Staged Framing of Preservation-Oriented Misalignment in Frontier Models

☆Fusion is the New Mutation: Bandit-Guided Evolution on Workflow Graphs

☆Gating Enables Curvature: A Geometric Expressivity Gap in Attention

☆Grad Detect: Gradient-Based Hallucination Detection in LLMs

☆Hidden in Plain Sight: Benchmarking Agent Safety Against Decomposition Attacks with DeCompBench

☆HINT: Task Demonstrations for Hierarchical Inference in Abstract Reasoning

☆How does RL Post-training Induce Skill Composition? A Case Study on Countdown

☆How Many Features Can a Language Model Store Under the Linear Representation Hypothesis?

☆IGG: A Benchmark for Interactive GUI Grounding under Visibility Constraints

☆Improving the Compositionality of Triplet-Based Neural Algorithmic Reasoners

☆In-Context Learning Amplifies a Latent Compositional Circuit

☆Installing and Obstructing Heuristics: Learning Dynamics in Nim

☆Introspective Coupling: LMs Explain Themselves Better Than Training Targets

☆Irreducible Supervision Enables Compositional Generalization in Post-Training

☆Language Elicits Emergent Symbol Processing in Vision Foundation Models

☆Large Language Models Can Follow Instructions, But Not Many at Once: Phase Transitions in Compositional Constraint Satisfaction

☆Learning Compositional Tasks via Trigger Compositions: Using Scratchpads as Pre-Answer Workspaces

☆Learning to Theorize the World from Observation

☆Learning What’s Missing: Failure-Driven Skill Discovery via Predicate Bridges

☆LGPro: Language-Guided Prototype Discovery for Compositional Zero-Shot Learning

A Compositional Calculus for Semantic Synergy in Language Model Embeddings

A mathematical theory of balancing relational generalization and memorization

A Theory of Atomic Features and Four Testable Predictions

Actionable Interpretability Must Be Defined in Terms of Symmetries: A Compositional Probabilistic Approach

Adaptive Minds: Empowering Agents with LoRA-as-Tools

Adaptive Recurrence as Algorithmic Time for Length Generalization in Addition

Additive Relational Bindings in Transformers: What Sparse Autoencoders Miss

Ask, Don’t Judge: Binary Questions for Interpretable LLM Evaluation and Self-Improvement

Atomic Chess Reveals Compositional Reasoning Failures in LLMs

Attractor Inversion: A Geometric Account of Adversarial Manipulation in Human Decision-Making

Beyond Safe Data: Pretraining-Stage Alignment with Regular Safety Reflection

Biregular Sparse Initialization Shifts the Rate and Shape of Compositional Escape in Sequential Arithmetic Curricula

CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents

Causal Cartographer: From Mapping to Reasoning Over Counterfactual Worlds

Causal-JEPA: Learning World Models through Object-Level Latent Masking

CB-Orchestrator: Adaptive Workflow Optimization for LLM Agents via Contextual Bandits

Chain-of-Thought Gradient Descent

Circuit Modularity Predicts Compositional Generalization: Theory and Evidence from Transformers

Circuit Oracle: Automating Attribution Graph Analysis via Natural-Language Queries

ClinSeekAgent: Automating Multi-modal Evidence Seeking for Agentic Clinical Reasoning

CLIP Models Generalize Less Than Compositional Benchmarks Suggest

CMAG: Concept-Scaffolded Retrieval for Marketplace Avatar Generation

Code-enabled language models can outperform reasoning models on diverse tasks

COGITAO: A Procedural and Object-Centric Framework to Evaluate Compositional and Systematic Generalization

CompFlow: Composing Velocity Fields for Multi-Condition Generation

Compositional Adversarial Training for Robust Visual Watermarking

Compositional Agentic Formulation Search for Open-Vocabulary Audio-Visual Event Localization

Compositional by Design: Background-Invariant Representations via Linear Additivity in VLMs

Compositional Consistency-Guided Decoding for Three-Way Logical Question Answering

Compositional Evolutionary Probing of LLM Safety Alignment

Compositional Failure in Audio-Visual LLMs: Late-Layer Prior Dominance Under Cross-modal Conflict

Compositional Investigation: Why Reasoning Enables Tool-Using Agents to Fix What They Diagnose

Compositional Neuro-Symbolic Reasoning

Compositional Self-Improvement

Compositional Skill Acquisition in Agentic Pipelines via Reinforcement Learning and Knowledge Distillation

Compositional Skill Chaining and Policy Blending for Hard Exploration in the BRIO Labyrinth Game

Compositional Skill Execution in LLM Multi-Agent Systems: A Comparative Study of Collaboration Architectures for Long-Horizon Tasks

Compositional Underdetermination in AI Agents: When Behavioral Success Is Not Compositional Evidence

Concepts in Motion: Temporal Concept Bottleneck Model for Interpretable Video Classification

Count Me If You Can: Geometric Failure Modes in Language Model Counting

CUA-Skill: Developing Computer Using Agents with a Skill Framework

Dimensionality Controls When Modularity Helps in Continual Learning

Direction-Conditioned Policies via Compositional Subgoal Scoring for Online Goal-Conditioned Reinforcement Learning

Dissociating Decodability and Causal Use in Bracket-Sequence Transformers

Do Thinking Tokens Help with Safety?

Don't Trust Stubborn Neighbors: A Security Framework for Agentic Networks

DPMI: A Principled Index for Neural Polysemanticity via Dirichlet Process Mixture Modeling

Dual-Resolution Recursive Energy: Certified Contract–Expand Inference for Sequential Decision Making

Emergent Compositional Skills in Mixture-of-Experts VLAs

Emergent Social Intelligence Risks in Generative Multi-Agent Systems

Entropy-Aware GUI Grounding: From Failure Analysis to Improved Localization

Evolution of Cooperation in LLM Societies : A Multi-Lingual Examination

Evolutionary System Prompt Learning for Reinforcement Learning in LLMs

Explaining is Harder Than Predicting Alone: Evaluating Concept-based Explanations of MLLMs as ICL Visual Classifiers

Fixed-Point Reasoning: Stable and Adaptive Deep Looped Models

FormalImG: Evaluating Structural Compositional Generalization for T2I Models

From Composition to Compositionality: Discovering Reusable Structure in Polyphonic Music Embeddings

From Mechanistic to Compositional Interpretability

From Numbers to Narratives: Goal-Oriented Summarization of Machine Learning Model Differences

From Self-Preservation to Peer-Preservation: A Staged Framing of Preservation-Oriented Misalignment in Frontier Models

Fusion is the New Mutation: Bandit-Guided Evolution on Workflow Graphs

Gating Enables Curvature: A Geometric Expressivity Gap in Attention

Grad Detect: Gradient-Based Hallucination Detection in LLMs

Hidden in Plain Sight: Benchmarking Agent Safety Against Decomposition Attacks with DeCompBench

HINT: Task Demonstrations for Hierarchical Inference in Abstract Reasoning

How does RL Post-training Induce Skill Composition? A Case Study on Countdown

How Many Features Can a Language Model Store Under the Linear Representation Hypothesis?

IGG: A Benchmark for Interactive GUI Grounding under Visibility Constraints

Improving the Compositionality of Triplet-Based Neural Algorithmic Reasoners

In-Context Learning Amplifies a Latent Compositional Circuit

Installing and Obstructing Heuristics: Learning Dynamics in Nim

Introspective Coupling: LMs Explain Themselves Better Than Training Targets

Irreducible Supervision Enables Compositional Generalization in Post-Training

Language Elicits Emergent Symbol Processing in Vision Foundation Models

Large Language Models Can Follow Instructions, But Not Many at Once: Phase Transitions in Compositional Constraint Satisfaction

Learning Compositional Tasks via Trigger Compositions: Using Scratchpads as Pre-Answer Workspaces

Learning to Theorize the World from Observation

Learning What’s Missing: Failure-Driven Skill Discovery via Predicate Bridges

LGPro: Language-Guided Prototype Discovery for Compositional Zero-Shot Learning

Logit Grafting: The Post-Training Delta is Sparse, Portable, and Powerful