ICML 2026PastLarge language modelsSafety & alignment

The Second Workshop on the Impact of Memorization on Trustworthy Foundation Models at ICML

ICML MemFM 2026 Workshop

Official website ↗OpenReview venue ↗See all ICML workshops →✎ Edit this entry

Submission deadline: May 9, 2026, 12:00 UTC
OpenReview-synced 2026-05-09 12:00 UTC (as of 2026-06-23) — extensions on OpenReview are applied automatically; verify on the website.
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (45)

Fetched from OpenReview (v2) on 2026-06-10.

\textsc{ContinuousBench}: Can Differentially Private Synthetic Text Improve Capabilities?
Peihan Liu, Lucas Rosenblatt, Weiwei Kong, Natalia Ponomareva, Gautam Kamath, Rachel Cummings, Roxana Geambasu, Yu Gan, Lillian Tsai, Alex Bie · PDF
Alignment Whack-a-Mole : Finetuning Activates Verbatim Recall of Copyrighted Books in Large Language Models
Xinyue Liu, Niloofar Mireshghallah, Jane C. Ginsburg, Tuhin Chakrabarty · PDF
Alignment-aware Data Selection for Unlearning in Contrastive Vision-Language Models
Dongjun Hwang, Yejin Kim, Beomyun Kwon, Junsuk Choe · PDF
Amplifying Membership Signal Through Iterative Regeneration
Stanisław Pawlak, Wojciech Łapacz · PDF
An Explicit Memory-Driven Agentic Framework for Power System Simulation
Qinjuan Wang, Yongli Zhu · PDF
Auditing Reasoning-Trace Memorization Claims after Unlearning with Head-Conditioned Canaries
Yanhang Li, Zhichao Fan, Zexin Zhuang · PDF
Bayes-Optimal Coexistence via Fact Localizability in Trainable-Feature Decoder-Only Transformers
Manoj Saravanan · PDF
Break the Output Geometry for Large Language Model Unlearning
Yejin Kim, William F. Shen, Seokwon Jung, Seong Joon Oh · PDF
Cheap Forgetting: Linear Adapter Interpolation as a Post-Hoc Memorization Mitigation
Anmol Pandey · PDF
Deployment-Time Memorization in Foundation-Model Agents
Rachel Chen, Guilin Zhang, Kai Zhao, Xu Chu, Amine Anoun, Jerry Ting · PDF
Detecting Functional Memorization in Code Language Models
Matthieu Meeus, Anil Ramakrishna, Matthew Grange, Zheng Xu, Luca Melis · PDF
Do Text Anonymizers Generalize Across Contexts? Extending RAT-Bench to Malaysian Microdata and PII
David Hong Liang Chew, Zexi Yao, Nataša Krčo, Matthieu Meeus, Waqas Khalid Obeidy, Yves-Alexandre de Montjoye · PDF
Estimating Model-Level Membership Inference Vulnerability Without Reference Models
Euodia Dodd, Nataša Krčo, Igor Shilov, Matthew Robert Wicker, Yves-Alexandre de Montjoye · PDF
Estimating near-verbatim extraction risk in language models with decoding-constrained beam search
A. Feder Cooper, Mark Lemley, Christopher De Sa, Lea Duesterwald, Allison Casasola, Jamie Hayes, Katherine Lee, Daniel E. Ho, Percy Liang · PDF
Evidence-bearing Insights under Differential Privacy: Beyond the Limits of Private Text Generation
Tsubasa Takahashi, Takumi Hiraoka · PDF
Internal Data Repetition Destroys Language Models
Jessica Chudnovsky, Joshua Kazdan, Noam Itzhak Levi, Rylan Schaeffer, Yegor Denisov-Blanch, Sanmi Koyejo, David L. Donoho · PDF
KVEraser: Learning to Steer KV Cache for Efficient Localized Context Erasing
Mufei Li, Shikun Liu, Dongqi Fu, Haoyu Peter Wang, Yinglong Xia, Hong Li, Hong Yan, Pan Li · PDF
Local Coverage Governs Memorization in Diffusion Models
Claudia Merger, Sebastian Goldt · PDF
Machine Text Detectors are Membership Inference Attacks
Ryuto Koike, Liam Dugan, Masahiro Kaneko, Chris Callison-Burch, Naoaki Okazaki · PDF
MemBoost: A Memory-Boosted Framework for Cost-Aware LLM Inference
Joris Köster, Zixuan Liu, Zizhan Zheng, Siavash H. Khajavi · PDF
Memorization Dynamics of Fill-in-the-Middle Pretraining
Tobias von Arx, Tanguy Dieudonné · PDF
Memorization Removal as a Two-Player Game: The Adversarial Work Criterion as a Test for Foundation-Model Defenses
Fryderyk Kuzma · PDF
Memory Adapters Enable Fast, Flexible Knowledge Unlearning in LLMs
Keltin Grimes, Kevin Kuo, Steven Wu, Virginia Smith, Marissa Catherine Connor · PDF
Mitigating Unintended Memory Use in LLMs via Structured Memory
Hakeem Hannoon, Andrew Zhao, Mihir Narayan, Sharvin Goyal, Ivaxi Sheth · PDF
NumLeak: Public Numeric Benchmarks as Latent Label in Foundation Models
Anany Kotawala · PDF
On Optimization Complexity of Second-Order Certified Unlearning
Nikita Doikov, Anastasia Koloskova · PDF
On the Geometry of Memorization: Interpolation and Second-Order Representation Irregularity
Satwik Bathula · PDF
On the Learning Dynamics of Label-Noise Memorization in ReLU MLPs
Yannis Kaltampanidis, Mykola Pechenizkiy, Hannah Pinson · PDF
Position: The Term “Machine Unlearning” Is Overused in LLMs
Sangyeon Yoon, Yeachan Jun, Albert No · PDF
Probing Memorization of Tabular In-Context Learning
Francesco Capano, Jonas Böhler · PDF
Probing Policy-Level Memorization in Reasoning LLMs via Atomic Chess
Ryan Co, Karthik Reddy Konuganti · PDF
Prune to Protect: Faster Training and Enhanced Privacy by Dynamic Data Pruning
Chinmay Joshi, Advait Gadhikar, Celia Rubio-Madrigal, Aneet Kumar Dutta, Mridula Singh, Rebekka Burkholz · PDF
Rare, Distinctive, Memorized: Auditing Memorization in Fine-Tuned Medical Foundation Models
Santhosh Parampottupadam, Sinem Sav, Dimitrios Bounias, Saikat Roy, Klaus Maier-Hein, Adam Dziedzic, Franziska Boenisch, Ralf Floca · PDF
Reconstructing Training Images from Foundation Model Parameters in the Healthcare Domain: Privacy Risks and Defences
Athanasios Panagiotis Glykos, Yannis Kaltampanidis, Mykola Pechenizkiy, Hannah Pinson · PDF
Scale Dependent Data Duplication
Joshua Kazdan, Noam Itzhak Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David L. Donoho · PDF
Semantic Gravity: When Parametric Memory Overpowers Visual Thermodynamics in Video-LLMs
Vidya Ganesh, Sethuraman T V, Aylmer Britto Rex Harison, Sibi Anitha Ragunathan · PDF
Structural Memorization in AlphaFold: Adversarial Mutations Reveal Template Reliance, Confidence Failures, and Implications for Protein Design
Jonathan Feldman, Maximilian Brogi, Jeffrey Skolnick · PDF
Suppression is not Deletion: Adversarial Probes Recover Unlearned Knowledge in Code LLMs
Dhairyasheel Patil, Gustavo Sandoval · PDF
SYMBOLICDRIFT: Measuring Reasoning Drift on Unverifiable Questions
Weijie Xu, Xi Fang, Yingqiang Ge, Yuhui Xu, Scott Nickleach, Stephanie Eckman, Chandan K. Reddy · PDF
Synthetic Data and the Rise of Spiky Intelligence
Abitha Thankaraj, Amro Abbas, Dongyang Fan, Vineeth Dorna, Luke Merrick, David J. Schwab, Anshuman Suri, Aldo Gael Carranza, Alex Fang, Alvin Deng, Brett W. Larsen, Darren Teh, Diego Kiner, Fan Pan, Haakon Mongstad, Haoli Yin, Jack Urbanek, Jason Chan Lee, Jason Telanoff, Josh Wills, Katherine L. Mentzer, Maximilian Böther, Parth Doshi, Paul Burstein, Rishabh Adiga, Siddharth Joshi, Tony Jiang, Vidhi Jain, Zhengping Wang, Yonatan Bisk, Bogdan Gaza, Ari S. Morcos, Matthew L Leavitt, Pratyush Maini · PDF
The Distillation Game: Adaptive Attacks & Efficient Defenses
Youssef Allouah, Mahdi Haghifam, Sanmi Koyejo, Reza Shokri · PDF
The Source of Competence Shapes Metacognition in Language Models
Roi Cohen, Gerard de Melo · PDF
Watermarking for Proprietary Dataset Protection
John Kirchenbauer, Brian R. Bartoldson, Bhavya Kailkhura, Tom Goldstein · PDF
What to Forget in Unlearning? Forget Set Curation for Language Models
Animesh Jha, Arpandeep Khatua, Youssef Allouah, Sanmi Koyejo · PDF
Why Forget-Only Unlearning Needs Memorization
Luka Radić, Vikrant Singhal, Amartya Sanyal · PDF

Accepted papers (45)

☆\textsc{ContinuousBench}: Can Differentially Private Synthetic Text Improve Capabilities?

☆Alignment Whack-a-Mole : Finetuning Activates Verbatim Recall of Copyrighted Books in Large Language Models

☆Alignment-aware Data Selection for Unlearning in Contrastive Vision-Language Models

☆Amplifying Membership Signal Through Iterative Regeneration

☆An Explicit Memory-Driven Agentic Framework for Power System Simulation

☆Auditing Reasoning-Trace Memorization Claims after Unlearning with Head-Conditioned Canaries

☆Bayes-Optimal Coexistence via Fact Localizability in Trainable-Feature Decoder-Only Transformers

☆Break the Output Geometry for Large Language Model Unlearning

☆Cheap Forgetting: Linear Adapter Interpolation as a Post-Hoc Memorization Mitigation

☆Deployment-Time Memorization in Foundation-Model Agents

☆Detecting Functional Memorization in Code Language Models

☆Do Text Anonymizers Generalize Across Contexts? Extending RAT-Bench to Malaysian Microdata and PII

☆Estimating Model-Level Membership Inference Vulnerability Without Reference Models

☆Estimating near-verbatim extraction risk in language models with decoding-constrained beam search

☆Evidence-bearing Insights under Differential Privacy: Beyond the Limits of Private Text Generation

☆Internal Data Repetition Destroys Language Models

☆KVEraser: Learning to Steer KV Cache for Efficient Localized Context Erasing

☆Local Coverage Governs Memorization in Diffusion Models

☆Machine Text Detectors are Membership Inference Attacks

☆MemBoost: A Memory-Boosted Framework for Cost-Aware LLM Inference

☆Memorization Dynamics of Fill-in-the-Middle Pretraining

☆Memorization Removal as a Two-Player Game: The Adversarial Work Criterion as a Test for Foundation-Model Defenses

☆Memory Adapters Enable Fast, Flexible Knowledge Unlearning in LLMs

☆Mitigating Unintended Memory Use in LLMs via Structured Memory

☆NumLeak: Public Numeric Benchmarks as Latent Label in Foundation Models

☆On Optimization Complexity of Second-Order Certified Unlearning

☆On the Geometry of Memorization: Interpolation and Second-Order Representation Irregularity

☆On the Learning Dynamics of Label-Noise Memorization in ReLU MLPs

☆Position: The Term “Machine Unlearning” Is Overused in LLMs

☆Probing Memorization of Tabular In-Context Learning

☆Probing Policy-Level Memorization in Reasoning LLMs via Atomic Chess

☆Prune to Protect: Faster Training and Enhanced Privacy by Dynamic Data Pruning

☆Rare, Distinctive, Memorized: Auditing Memorization in Fine-Tuned Medical Foundation Models

☆Reconstructing Training Images from Foundation Model Parameters in the Healthcare Domain: Privacy Risks and Defences

☆Scale Dependent Data Duplication

☆Semantic Gravity: When Parametric Memory Overpowers Visual Thermodynamics in Video-LLMs

☆Structural Memorization in AlphaFold: Adversarial Mutations Reveal Template Reliance, Confidence Failures, and Implications for Protein Design

☆Suppression is not Deletion: Adversarial Probes Recover Unlearned Knowledge in Code LLMs

☆SYMBOLICDRIFT: Measuring Reasoning Drift on Unverifiable Questions

☆Synthetic Data and the Rise of Spiky Intelligence

☆The Distillation Game: Adaptive Attacks & Efficient Defenses

☆The Source of Competence Shapes Metacognition in Language Models

☆Watermarking for Proprietary Dataset Protection

☆What to Forget in Unlearning? Forget Set Curation for Language Models

☆Why Forget-Only Unlearning Needs Memorization

\textsc{ContinuousBench}: Can Differentially Private Synthetic Text Improve Capabilities?

Alignment Whack-a-Mole : Finetuning Activates Verbatim Recall of Copyrighted Books in Large Language Models

Alignment-aware Data Selection for Unlearning in Contrastive Vision-Language Models

Amplifying Membership Signal Through Iterative Regeneration

An Explicit Memory-Driven Agentic Framework for Power System Simulation

Auditing Reasoning-Trace Memorization Claims after Unlearning with Head-Conditioned Canaries

Bayes-Optimal Coexistence via Fact Localizability in Trainable-Feature Decoder-Only Transformers

Break the Output Geometry for Large Language Model Unlearning

Cheap Forgetting: Linear Adapter Interpolation as a Post-Hoc Memorization Mitigation

Deployment-Time Memorization in Foundation-Model Agents

Detecting Functional Memorization in Code Language Models

Do Text Anonymizers Generalize Across Contexts? Extending RAT-Bench to Malaysian Microdata and PII

Estimating Model-Level Membership Inference Vulnerability Without Reference Models

Estimating near-verbatim extraction risk in language models with decoding-constrained beam search

Evidence-bearing Insights under Differential Privacy: Beyond the Limits of Private Text Generation

Internal Data Repetition Destroys Language Models

KVEraser: Learning to Steer KV Cache for Efficient Localized Context Erasing

Local Coverage Governs Memorization in Diffusion Models

Machine Text Detectors are Membership Inference Attacks

MemBoost: A Memory-Boosted Framework for Cost-Aware LLM Inference

Memorization Dynamics of Fill-in-the-Middle Pretraining

Memorization Removal as a Two-Player Game: The Adversarial Work Criterion as a Test for Foundation-Model Defenses

Memory Adapters Enable Fast, Flexible Knowledge Unlearning in LLMs

Mitigating Unintended Memory Use in LLMs via Structured Memory

NumLeak: Public Numeric Benchmarks as Latent Label in Foundation Models

On Optimization Complexity of Second-Order Certified Unlearning

On the Geometry of Memorization: Interpolation and Second-Order Representation Irregularity

On the Learning Dynamics of Label-Noise Memorization in ReLU MLPs

Position: The Term “Machine Unlearning” Is Overused in LLMs

Probing Memorization of Tabular In-Context Learning

Probing Policy-Level Memorization in Reasoning LLMs via Atomic Chess

Prune to Protect: Faster Training and Enhanced Privacy by Dynamic Data Pruning

Rare, Distinctive, Memorized: Auditing Memorization in Fine-Tuned Medical Foundation Models

Reconstructing Training Images from Foundation Model Parameters in the Healthcare Domain: Privacy Risks and Defences

Scale Dependent Data Duplication

Semantic Gravity: When Parametric Memory Overpowers Visual Thermodynamics in Video-LLMs

Structural Memorization in AlphaFold: Adversarial Mutations Reveal Template Reliance, Confidence Failures, and Implications for Protein Design

Suppression is not Deletion: Adversarial Probes Recover Unlearned Knowledge in Code LLMs

SYMBOLICDRIFT: Measuring Reasoning Drift on Unverifiable Questions

Synthetic Data and the Rise of Spiky Intelligence

The Distillation Game: Adaptive Attacks & Efficient Defenses

The Source of Competence Shapes Metacognition in Language Models

Watermarking for Proprietary Dataset Protection

What to Forget in Unlearning? Forget Set Curation for Language Models

Why Forget-Only Unlearning Needs Memorization