ICML 2025PastAgents

ICML 2025 Workshop on Programmatic Representations for Agent Learning

ICML 2025 Workshop PRAL

Official website ↗OpenReview venue ↗See all ICML workshops →✎ Edit this entry

Submission deadline: May 31, 2025, 11:59 UTC
imported from OpenReview — check the website for extensions
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (26)

Fetched from OpenReview (v2) on 2026-06-10.

Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization
Mingzhe Du, Anh Tuan Luu, Yue Liu, Yuhao QING, Dong HUANG, Xinyi He, Qian Liu, Zejun MA, See-Kiong Ng · PDF
Discovering Logic-Informed Intrinsic Rewards to Explain Human Policies
Chengzhi Cao, Yinghao Fu, Chao Yang, Shuang Li · PDF
DyPO: Dynamic Policy Optimization for Multi-Turn Interactive Reasoning
Xiao Feng, Bo Han, Zhanke Zhou, Jiaqi Fan, Jiangchao Yao, Ka Ho Li, Dahai Yu, Michael Ng · PDF
EditLord: Learning Code Transformation Rules for Code Editing
Weichen Li, Albert Jan, Baishakhi Ray, Junfeng Yang, Chengzhi Mao, Kexin Pei · PDF
FormulaCode: Evaluating Agentic Superoptimization on Large Codebases
Atharva Sehgal, James Hou, Swarat Chaudhuri, Jennifer J. Sun, Yisong Yue · PDF
How Robust Reinforcement Learning Enables Courier-Friendly Route Planning for Last-Mile Delivery?
Ziying Jia, Zeyu Dong, Miao Yin, Sihong He · PDF
Improving LLM Agent Planning with In-Context Learning via Atomic Fact Augmentation and Lookahead Search
Samuel Holt, Max Ruiz Luyten, Thomas Pouplin, Mihaela van der Schaar · PDF
Improving Parallel Program Performance with LLM Optimizers via Agent-System Interfaces
Anjiang Wei, Allen Nie, Thiago S. F. X. Teixeira, Rohan Yadav, Wonchan Lee, Ke Wang, Alex Aiken · PDF
Inefficiencies of Meta Agents for Agent Design
Batu El, Mert Yuksekgonul, James Zou · PDF
InstructFlow: Adaptive Symbolic Constraint-Guided Code Generation for Long-Horizon Planning
Haotian Chi, Zeyu Feng, Yueming Lyu, Chengqi Zheng, Linbo Luo, Yew-Soon Ong, Ivor Tsang, Hechang Chen, Yi Chang, Haiyan Yin · PDF
Interpretable Reward Modeling with Active Concept Bottlenecks
Sonia Laguna, Kasia Kobalczyk, Julia E Vogt, Mihaela van der Schaar · PDF
Large Language Models Can Think and Act Probabilistically
Kou Misaki, Takuya Akiba · PDF
Learned Representations Enhance Multi Agent Path Planning
Marius Captari, Herke van Hoof · PDF
Learning Game-Playing Agents with Generative Code Optimization
Zhiyi Kuang, Ryan Rong, YuCheng Yuan, Allen Nie · PDF
Learning to Discover Abstractions for LLM Reasoning
Yuxiao Qu, Anikait Singh, Yoonho Lee, Amrith Setlur, Ruslan Salakhutdinov, Chelsea Finn, Aviral Kumar · PDF
Leveraging LLM-based sentiment analysis for portfolio optimization with proximal policy optimization
Kemal Kirtac, Guido Germano · PDF
Lifelong Experience Abstraction and Planning
Peiqi Liu, Leslie Pack Kaelbling, Joshua B. Tenenbaum, Jiayuan Mao · PDF
Making LLMs Program Interpreters via Execution Trace Chain of Thought
Koshi Eguchi, Takuya Akiba · PDF
Optimizing Agentic Architectures for Cybersecurity Tasks with Trace
Anish Chaudhuri, Prerit Choudhary, Max Piasevoli, Shannon Xiao, Allen Nie · PDF
ReasonRec: A Reasoning-Augmented Multimodal Agent for Unified Recommendation
Yihua Zhang, Xi Liu, Xihuan Zeng, Mingfu Liang, Jiyan Yang, Rong Jin, Wen-Yen Chen, Yiping Han, Hao Ma, Bo Long, Huayu Li, Buyun Zhang, Liang Luo, Sijia Liu, Tianlong Chen · PDF
Representing Prompting Patterns with PDL: Compliance Agent Case Study
Mandana Vaziri, Louis Mandel, Yuji Watanabe, Hirokuni Kitahara, Martin Hirzel, Anca Sailer · PDF
Searching Latent Program Spaces
Matthew Macfarlane, Clément Bonnet · PDF
Sketch-Plan-Generalize : Learning and Planning with Neuro-Symbolic Programmatic Representations for Inductive Spatial Concepts
Namasivayam Kalithasan, Sachit Sachdeva, Gurarmaan Singh Panjeta, Harsh Himanshu Vora, Himanshu Gaurav Singh, Vishal Bindal, Arnav Tuli, Divyanshu Agarwal, Rohan Paul, Parag Singla · PDF
Time to Impeach LLM-as-a-Judge: Programs are the Future of Evaluation
Tzu-Heng Huang, Harit Vishwakarma, Frederic Sala · PDF
Weak-for-Strong: Training Weak Meta-Agent to Harness Strong Executors
Fan Nie, Lan Feng, Haotian Ye, Weixin Liang, Pan Lu, Huaxiu Yao, Alexandre Alahi, James Zou · PDF
Zero-Shot Instruction Following in RL via Structured LTL Representations
Mattia Giuri, Mathias Jackermeier, Alessandro Abate · PDF

Accepted papers (26)

☆Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization

☆Discovering Logic-Informed Intrinsic Rewards to Explain Human Policies

☆DyPO: Dynamic Policy Optimization for Multi-Turn Interactive Reasoning

☆EditLord: Learning Code Transformation Rules for Code Editing

☆FormulaCode: Evaluating Agentic Superoptimization on Large Codebases

☆How Robust Reinforcement Learning Enables Courier-Friendly Route Planning for Last-Mile Delivery?

☆Improving LLM Agent Planning with In-Context Learning via Atomic Fact Augmentation and Lookahead Search

☆Improving Parallel Program Performance with LLM Optimizers via Agent-System Interfaces

☆Inefficiencies of Meta Agents for Agent Design

☆InstructFlow: Adaptive Symbolic Constraint-Guided Code Generation for Long-Horizon Planning

☆Interpretable Reward Modeling with Active Concept Bottlenecks

☆Large Language Models Can Think and Act Probabilistically

☆Learned Representations Enhance Multi Agent Path Planning

☆Learning Game-Playing Agents with Generative Code Optimization

☆Learning to Discover Abstractions for LLM Reasoning

☆Leveraging LLM-based sentiment analysis for portfolio optimization with proximal policy optimization

☆Lifelong Experience Abstraction and Planning

☆Making LLMs Program Interpreters via Execution Trace Chain of Thought

☆Optimizing Agentic Architectures for Cybersecurity Tasks with Trace

☆ReasonRec: A Reasoning-Augmented Multimodal Agent for Unified Recommendation

☆Representing Prompting Patterns with PDL: Compliance Agent Case Study

☆Searching Latent Program Spaces

☆Sketch-Plan-Generalize : Learning and Planning with Neuro-Symbolic Programmatic Representations for Inductive Spatial Concepts

☆Time to Impeach LLM-as-a-Judge: Programs are the Future of Evaluation

☆Weak-for-Strong: Training Weak Meta-Agent to Harness Strong Executors

☆Zero-Shot Instruction Following in RL via Structured LTL Representations

Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization

Discovering Logic-Informed Intrinsic Rewards to Explain Human Policies

DyPO: Dynamic Policy Optimization for Multi-Turn Interactive Reasoning

EditLord: Learning Code Transformation Rules for Code Editing

FormulaCode: Evaluating Agentic Superoptimization on Large Codebases

How Robust Reinforcement Learning Enables Courier-Friendly Route Planning for Last-Mile Delivery?

Improving LLM Agent Planning with In-Context Learning via Atomic Fact Augmentation and Lookahead Search

Improving Parallel Program Performance with LLM Optimizers via Agent-System Interfaces

Inefficiencies of Meta Agents for Agent Design

InstructFlow: Adaptive Symbolic Constraint-Guided Code Generation for Long-Horizon Planning

Interpretable Reward Modeling with Active Concept Bottlenecks

Large Language Models Can Think and Act Probabilistically

Learned Representations Enhance Multi Agent Path Planning

Learning Game-Playing Agents with Generative Code Optimization

Learning to Discover Abstractions for LLM Reasoning

Leveraging LLM-based sentiment analysis for portfolio optimization with proximal policy optimization

Lifelong Experience Abstraction and Planning

Making LLMs Program Interpreters via Execution Trace Chain of Thought

Optimizing Agentic Architectures for Cybersecurity Tasks with Trace

ReasonRec: A Reasoning-Augmented Multimodal Agent for Unified Recommendation

Representing Prompting Patterns with PDL: Compliance Agent Case Study

Searching Latent Program Spaces

Sketch-Plan-Generalize : Learning and Planning with Neuro-Symbolic Programmatic Representations for Inductive Spatial Concepts

Time to Impeach LLM-as-a-Judge: Programs are the Future of Evaluation

Weak-for-Strong: Training Weak Meta-Agent to Harness Strong Executors

Zero-Shot Instruction Following in RL via Structured LTL Representations