ICLR 2026PastAI for science

Workshop on Scientific Methods for Understanding Deep Learning

Sci4DL 2026

Official website ↗OpenReview venue ↗See all ICLR workshops →✎ Edit this entry

Submission deadline: Feb 5, 2026, 12:10 UTC
OpenReview-synced 2026-02-05 12:10 UTC (as of 2026-06-23) — extensions on OpenReview are applied automatically; verify on the website.
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (88)

Fetched from OpenReview (v2) on 2026-06-10.

"Faithful to What?" On the Limits of Fidelity-Based Explanations
Jackson Eshbaugh · PDF
Ablate and Rescue: A Causal Analysis of Residual Stream Hyper-Connections
William Gao Peng, Josheev Rai, Kevin Tseng, Siwei Wang, Sean Wu · PDF
All in the Head?: A Controlled Study of Component Contributions in Few-Shot NLP
Rishaan Desai · PDF
Analysing the Linearity of Linguistic Relations in Language Model Embedding Spaces
Vasudevan Nedumpozhimana, Fathima Thekkekara, John Kelleher · PDF
Attention Projection Mixing with Exogenous Anchors
Jonathan Su · PDF
Attention Sinks as Internal Signals for Hallucination Detection in Large Language Models
Jakub Binkowski, Kamil Adamczewski, Tomasz Jan Kajdanowicz · PDF
Birkhoff-Exact Hyper-Connections: Exact Spectral Stability for Deep Residual Networks
Hyunjun Kim · PDF
Configuration-to-Performance Scaling Law with Neural Ansatz
Huaqing Zhang, Kaiyue Wen, Tengyu Ma · PDF
Decoupled Orthogonal Dynamics: Regularization for Deep Network Optimizers
Hao Chen, Jh Yuan, Hanmin Zhang · PDF
Deriving Hyperparameter Scaling Laws via Modern Optimization Theory
Egor Shulgin, Dimitri von Rütte, Tianyue H. Zhang, Niccolò Ajroldi, Bernhard Schölkopf, Antonio Orvieto · PDF
DIAGNOSING FP4 INFERENCE: A LAYER-WISE AND BLOCK-WISE SENSITIVITY ANALYSIS OF NVFP4 AND MXFP4
Musa Cim, Burak Topcu, Mahmut Kandemir · PDF
Divergent Tasks Harm Integration Of New Entities Via Fine-Tuning
Core Francisco Park · PDF
Divine Benevolence is an $x^2$: GLUs have asymptotically faster scaling laws than MLPs
Alejandro Francisco Queiruga · PDF
Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis
Ferdinand Kapl, Emmanouil Angelis, Tobias Höppe, Kaitlin Maile, Johannes von Oswald, Nino Scherrer, Stefan Bauer · PDF
Does Aurora Encode Atmospheric Structure? Latent Regime Analysis and Attribution
Emma Kasteleyn, Ana Lucic · PDF
Does LLM Pre-Training Typically Occur at the Edge of Stability?
Yuhang Cai, Haofeng Huang, Haodong Wen, Deyi Liu, Yiyuan Ma, Kaifeng Lyu · PDF
Dropout and the Outliers: Could Transformers Overcome Their Single Points of Failure?
Nour Hezbri, Gilles Bareilles, El-Mahdi El-Mhamdi · PDF
Endogenous Resistance to Activation Steering in Language Models
Alex McKenzie, Keenan Pepper, Stijn Servaes, Martin Leitgab, Murat Cubuktepe, Michael Vaiana, Diogo S de Lucena, Judd Rosenblatt, Michael S. A. Graziano · PDF
Entropy-Lens: Uncovering Decision Strategies in LLMs
Christopher Irwin, Francesco Caso, Riccardo Ali, Pietro Lio · PDF
Evidence Slopes and Effective Dimension in Singular Linear Models
Kalyaan Rao · PDF
Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models
Marcos Villagra, Bidhan Roy, Raihan Seraj, Zhiying Jiang · PDF
From Growing to Looping: A Unified View of Iterative Computation in LLMs
Ferdinand Kapl, Emmanouil Angelis, Kaitlin Maile, Johannes von Oswald, Stefan Bauer · PDF
Generalized Dual-Scale Optimization: Topology-Aware Margin Dynamics in Fine-Grained Vision
lingfeng xia · PDF
Generating output diversity from prompt re-tokenization
Kanishk Jain, Matthew Day, Tankut Can · PDF
Genomic Next-Token Predictors are In-Context Learners
Nathan Breslow, Aayush Mishra, Michael Schatz, Anqi Liu, Mahler Revsine, Daniel Khashabi · PDF
Geometric Properties of Neural Multivariate Regression: An Empirical Study
George Andriopoulos, Zixuan Dong, Bimarsha Adhikari, Keith W. Ross · PDF
Geometric Stability of Representation Manifolds as a Training-Free Diagnostic for Studying Data Augmentations
Ahmad Taha, Rustam A. Lukmanov · PDF
Gradual Stochastic Gradient Descent: from signSGD to SGD via $\ell_p$ Norm
Jh Yuan, Liu Jiachen, Feiping Nie · PDF
Homophily as a Lossy Channel: Decomposing Information in Graphs and Graph Neural Networks
Vivek Kothari, Nicholas D. Lane · PDF
In-Context Benign Overfitting: A Feature-Selection Model in In-Context Linear Regression
Puneesh Deora, Bhavya Vasudeva, Christos Thrampoulidis · PDF
Information spreading in diffusion models from effective field theory
Navonil Neogi, Nabil Iqbal · PDF
Instruction Following by Principled Attention Boosting of Large Language Models
Vitoria Guardieiro, Avishree Khare, Adam Stein, Eric Wong · PDF
Is GPU Numerical Noise Really Random? An Empirical Investigation of Floating-Point Error Structure
Tadisetty Sai Yashwanth · PDF
LAYER-DEPENDENT STRUCTURE IN GRADIENT NOISE OF SMALL CONVOLUTIONAL NETWORKS
Mahule Roy, Subhas Roy · PDF
Learning When to Be Sparse: Adaptive Activations via Two-Parameter Entropy
Roman Rudamenko, Dmitry Abulkhanov, Konstantin Semenov, Michael Diskin, Alexander Savchenko · PDF
Less Data, Faster Training: sampling bias from small dataset can speed up training
Jingwen Liu, Ezra Edelman, Surbhi Goel, Bingbin Liu · PDF
Leveraging Low-Rank Structure for Effective Weight-Sharing in Language Models
Mark Muchane, George Sokolik, Micah Goldblum, Sanae Lotfi · PDF
Masks Can Be Distracting: On Context Comprehension in Diffusion Language Models
Julianna Piskorz, Cristina Pinneri, Alvaro Correia, Motasem Alfarra, Risheek Garrepalli, Christos Louizos · PDF
Model Evolution Under Zeroth-Order Optimization: A Neural Tangent Kernel Perspective
Chen Zhang, Yuxin Cheng, Chenchen Ding, Shuqi Wang, Jingreng Lei, Runsheng Yu, Yik-Chung WU, Ngai Wong · PDF
Multi-Task Pretraining Drives Representational Convergence
Core Francisco Park · PDF
Network of Theseus (Like the ship)
Vighnesh Subramaniam, Colin Conwell, Boris Katz, Andrei Barbu, Brian Cheung · PDF
Neural Multivariate Regression with Multi-Task Learning and Target Preprocessing
George Andriopoulos, Soyuj Jung Basnet, Juan Guevara, Bimarsha Adhikari, Li Guo, Keith W. Ross · PDF
Normalized Conditional Mutual Information Surrogate Loss for Deep Learning Classifiers
Linfeng Ye, Zhixiang Chi · PDF
On the "Induction Bias" in Sequence Models
Reza Ebrahimi, Michaël Defferrard, Sunny Panchal, Roland Memisevic · PDF
On the Complexity of Neural Computation in Superposition
Micah Adler, Nir N Shavit · PDF
On the Simplicity-Similarity Tradeoff of LoRA and Full Fine-Tuning
Jerome Emery, Darshan Patil, François Leduc-Primeau, Sarath Chandar, Ekaterina Lobacheva · PDF
Optimal learning rate scaling depends on data in deep scalar linear networks
Yedi Zhang, Peter E. Latham, Leena Chennuru Vankadara, Andrew M Saxe · PDF
Optimal scaling laws in learning hierarchical multi-index models
Leonardo Defilippis, Florent Krzakala, Bruno Loureiro, Antoine Maillard · PDF
Optimization, Not Architecture, Governs Vision Transformer Generalization in Small-Data Regimes
Divyanshu Gupta · PDF
Pretraining with Masked Backstories in a Toy World
Sultan Daniels, Dylan Davis, Gireeja Ranade, Anant Sahai · PDF
PROBING INFORMATION FLOW IN VISION TRANSFORMERS THROUGH CONTROLLED ATTENTION PERTURBATION
Thanh Do, Abe Leite · PDF
Process-then-Retrieve: A Mechanistic Study of Cross-Modal Alignment in Vision-Language Models
Arpita A Shanbhag, Julia Tran, Dhruv Reddy Mandala, Ayda Sultan · PDF
Representation Geometry Mediates Neural Circuit Formation: Evidence from Systematic Regularization Analysis
Hyunjun Kim · PDF
Revealing Task-Dependent Layer Relevance via Attentive Multi-Layer Fusion
Marco Morik, Laure Ciernik, Lukas Thede, Luca Eyring, Shinichi Nakajima, Zeynep Akata, Lukas Muttenthaler · PDF
RouterInterp: Understanding Superposed Specialisation in MoE Routing
Ilya Lasy, Nora Yinuo Cai, Kola Ayonrinde · PDF
Scaling-Law Analysis of SignSGD: From Feature-Space Linear Regression to LLM Pre-training
Binghui Li, Jianan Wang, Jinbo Wang, Lean Wang, Zilin Wang, Lei Wu · PDF
Shared Gradient Discovery and Superposition: Learning Dynamics of Generalization in LLMs
Andrei Mircea, Ildus Sadrtdinov, Irina Rish, Ekaterina Lobacheva · PDF
Sharpness-Aware Pretraining Mitigates Catastrophic Forgetting
Ishaan Watts, Catherine Li, Sachin Goyal, Jacob Mitchell Springer, Aditi Raghunathan · PDF
Simple LLM Baselines are Competitive for Model Diffing
Elias Kempf, Simon Schrodi, Bartosz Cywiński, Thomas Brox, Neel Nanda, Arthur Conmy · PDF
Single-Head Attention in High Dimensions: A Theory of Generalization, Weights Spectra, and Scaling Laws
Fabrizio Boncoraglio, Vittorio Erba, Emanuele Troiani, Yizhou Xu, Florent Krzakala, Lenka Zdeborová · PDF
Skip To The Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs Autoregressive LLM
Raghavv Goel, Risheek Garrepalli, Sudhanshu Agrawal, Christopher Lott, Fatih Porikli, Mingu Lee · PDF
Soft Gates for Sharp Experts in Tabular Representation Learning
Iago Breno Araujo · PDF
Special solutions with small volume exist
Tausifa Jan Saleem, Ramanjit Ahuja, Surendra Prasad, Brejesh Lall · PDF
Spherical Cautious Optimizers
Jh Yuan, Feiping Nie · PDF
Steered LLM Activations are Non-Surjective
Aayush Mishra, Daniel Khashabi, Anqi Liu · PDF
STRIDE: Training Data Attribution Can Be Estimated In Activation Space
Abir HARRASSE, Rishit Dagli, Amir Abdullah, Zhijing Jin · PDF
Sustained Gradient Alignment Mediates Subliminal Learning in a Multi-Step Setting: Evidence from MNIST Auxiliary Logit Distillation Experiment
Chayanon Kitkana, Shivam Arora · PDF
The Feature-Space Alignment Hypothesis for Neural Network Sparsity
Linghao Kong, Micah Adler, Nir N Shavit · PDF
The Offline-Frontier Shift: Diagnosing Distributional Limits in Generative Multi-Objective Optimization
Stephanie Holly, Alexandru-Ciprian Zavoianu, Siegfried Silber, Sepp Hochreiter, Werner Zellinger · PDF
The Role of Data in Model Merging
Gaurav Iyer, Ekaterina Lobacheva · PDF
Thermodynamics of Reinforcement Learning Curricula
Jacob Adamczyk, Juan Sebastian Rojas, Rahul V Kulkarni · PDF
To Use or not to Use Muon: How Simplicity Bias in Optimizers Matters
Sara Dragutinović, Rajesh Ranganath · PDF
Toy Models of Combinatorial Interpretability
Nir N Shavit, Dan Alistarh, Micah Adler · PDF
Training for Compositional Sensitivity Reduces Dense Retrieval Generalization
Radoslav Ralev, Aditeya Baral, Iliya Sotirov Zhechev, Jen Agarwal, Srijith Rajamohan · PDF
TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers
Peng Cheng, Jiucheng Zang, Qingnan Li, Liheng Ma, Yufei Cui, Yingxue Zhang, Boxing Chen, Ming Jian, Wen Tong · PDF
Understanding Contextual Recall in Transformers: How Finetuning Enables In-Context Reasoning over Pretraining Knowledge
Bhavya Vasudeva, Puneesh Deora, Alberto Bietti, Vatsal Sharan, Christos Thrampoulidis · PDF
Understanding Learning Dynamics of Zeroth-Order Optimization
Zhe Li, Bicheng Ying, Zidong Liu, Haibo Yang · PDF
Understanding Scaling Laws With Token-Level Analysis
Arkil Patel, Marius Mosbach, Siva Reddy, Dzmitry Bahdanau · PDF
Unified Perspectives on Balancedness and Parameter-norm Evolution in Neural Nets
Jasraj Singh, Enea Monzio Compagnoni, Antonio Orvieto · PDF
Vision Language Models Inherit Human Color Perception
Core Francisco Park · PDF
Weight Decay Improves Language Model Plasticity
Tessa Han, Sebastian Bordt, Hanlin Zhang, Sham M. Kakade · PDF
What Flow-Matching Brings to TD Learning?
Bhavya Kumar Agrawalla, Michal Nauman, Aviral Kumar · PDF
When Does Diffusion Help? PDE-Inspired Optimization on Fragmented and Noisy Data
Rahul D Ray · PDF
WHEN DOES META LEARNING ACTUALLY HELP? A SCIENTIFIC STUDY OF PHYSICAL INVERSE PROBLEMS
Rahul D Ray · PDF
When does Observational Data Teach Latent Dynamics? Understanding Control Misalignment with Synthetic Tasks
Kento Nishi, Raphael Tang, Karun Kumar, Core Francisco Park, Hidenori Tanaka · PDF
When to restart? Exploring escalating restarts on convergence
Ayush K. Varshney, Sarunas Girdzijauskas, Konstantinos Vandikas, Aneta Vulgarakis Feljan · PDF
Which Sparse Code? Identifiability Failures in SAE Inference
Alessa Carbo, Eric Nalisnick · PDF
Zeroth-Order Optimization at the Edge of Stability
Minhak Song, Liang Zhang, Bingcong Li, Niao He, Michael Muehlebach, Sewoong Oh · PDF

Accepted papers (88)

☆"Faithful to What?" On the Limits of Fidelity-Based Explanations

☆Ablate and Rescue: A Causal Analysis of Residual Stream Hyper-Connections

☆All in the Head?: A Controlled Study of Component Contributions in Few-Shot NLP

☆Analysing the Linearity of Linguistic Relations in Language Model Embedding Spaces

☆Attention Projection Mixing with Exogenous Anchors

☆Attention Sinks as Internal Signals for Hallucination Detection in Large Language Models

☆Birkhoff-Exact Hyper-Connections: Exact Spectral Stability for Deep Residual Networks

☆Configuration-to-Performance Scaling Law with Neural Ansatz

☆Decoupled Orthogonal Dynamics: Regularization for Deep Network Optimizers

☆Deriving Hyperparameter Scaling Laws via Modern Optimization Theory

☆DIAGNOSING FP4 INFERENCE: A LAYER-WISE AND BLOCK-WISE SENSITIVITY ANALYSIS OF NVFP4 AND MXFP4

☆Divergent Tasks Harm Integration Of New Entities Via Fine-Tuning

☆Divine Benevolence is an $x^2$: GLUs have asymptotically faster scaling laws than MLPs

☆Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis

☆Does Aurora Encode Atmospheric Structure? Latent Regime Analysis and Attribution

☆Does LLM Pre-Training Typically Occur at the Edge of Stability?

☆Dropout and the Outliers: Could Transformers Overcome Their Single Points of Failure?

☆Endogenous Resistance to Activation Steering in Language Models

☆Entropy-Lens: Uncovering Decision Strategies in LLMs

☆Evidence Slopes and Effective Dimension in Singular Linear Models

☆Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

☆From Growing to Looping: A Unified View of Iterative Computation in LLMs

☆Generalized Dual-Scale Optimization: Topology-Aware Margin Dynamics in Fine-Grained Vision

☆Generating output diversity from prompt re-tokenization

☆Genomic Next-Token Predictors are In-Context Learners

☆Geometric Properties of Neural Multivariate Regression: An Empirical Study

☆Geometric Stability of Representation Manifolds as a Training-Free Diagnostic for Studying Data Augmentations

☆Gradual Stochastic Gradient Descent: from signSGD to SGD via $\ell_p$ Norm

☆Homophily as a Lossy Channel: Decomposing Information in Graphs and Graph Neural Networks

☆In-Context Benign Overfitting: A Feature-Selection Model in In-Context Linear Regression

☆Information spreading in diffusion models from effective field theory

☆Instruction Following by Principled Attention Boosting of Large Language Models

☆Is GPU Numerical Noise Really Random? An Empirical Investigation of Floating-Point Error Structure

☆LAYER-DEPENDENT STRUCTURE IN GRADIENT NOISE OF SMALL CONVOLUTIONAL NETWORKS

☆Learning When to Be Sparse: Adaptive Activations via Two-Parameter Entropy

☆Less Data, Faster Training: sampling bias from small dataset can speed up training

☆Leveraging Low-Rank Structure for Effective Weight-Sharing in Language Models

☆Masks Can Be Distracting: On Context Comprehension in Diffusion Language Models

☆Model Evolution Under Zeroth-Order Optimization: A Neural Tangent Kernel Perspective

☆Multi-Task Pretraining Drives Representational Convergence

☆Network of Theseus (Like the ship)

☆Neural Multivariate Regression with Multi-Task Learning and Target Preprocessing

☆Normalized Conditional Mutual Information Surrogate Loss for Deep Learning Classifiers

☆On the "Induction Bias" in Sequence Models

☆On the Complexity of Neural Computation in Superposition

☆On the Simplicity-Similarity Tradeoff of LoRA and Full Fine-Tuning

☆Optimal learning rate scaling depends on data in deep scalar linear networks

☆Optimal scaling laws in learning hierarchical multi-index models

☆Optimization, Not Architecture, Governs Vision Transformer Generalization in Small-Data Regimes

☆Pretraining with Masked Backstories in a Toy World

☆PROBING INFORMATION FLOW IN VISION TRANSFORMERS THROUGH CONTROLLED ATTENTION PERTURBATION

☆Process-then-Retrieve: A Mechanistic Study of Cross-Modal Alignment in Vision-Language Models

☆Representation Geometry Mediates Neural Circuit Formation: Evidence from Systematic Regularization Analysis

☆Revealing Task-Dependent Layer Relevance via Attentive Multi-Layer Fusion

☆RouterInterp: Understanding Superposed Specialisation in MoE Routing

☆Scaling-Law Analysis of SignSGD: From Feature-Space Linear Regression to LLM Pre-training

☆Shared Gradient Discovery and Superposition: Learning Dynamics of Generalization in LLMs

☆Sharpness-Aware Pretraining Mitigates Catastrophic Forgetting

☆Simple LLM Baselines are Competitive for Model Diffing

☆Single-Head Attention in High Dimensions: A Theory of Generalization, Weights Spectra, and Scaling Laws

☆Skip To The Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs Autoregressive LLM

☆Soft Gates for Sharp Experts in Tabular Representation Learning

☆Special solutions with small volume exist

☆Spherical Cautious Optimizers

☆Steered LLM Activations are Non-Surjective

☆STRIDE: Training Data Attribution Can Be Estimated In Activation Space

☆Sustained Gradient Alignment Mediates Subliminal Learning in a Multi-Step Setting: Evidence from MNIST Auxiliary Logit Distillation Experiment

☆The Feature-Space Alignment Hypothesis for Neural Network Sparsity

☆The Offline-Frontier Shift: Diagnosing Distributional Limits in Generative Multi-Objective Optimization

☆The Role of Data in Model Merging

☆Thermodynamics of Reinforcement Learning Curricula

☆To Use or not to Use Muon: How Simplicity Bias in Optimizers Matters

☆Toy Models of Combinatorial Interpretability

☆Training for Compositional Sensitivity Reduces Dense Retrieval Generalization

☆TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

☆Understanding Contextual Recall in Transformers: How Finetuning Enables In-Context Reasoning over Pretraining Knowledge

☆Understanding Learning Dynamics of Zeroth-Order Optimization

☆Understanding Scaling Laws With Token-Level Analysis

☆Unified Perspectives on Balancedness and Parameter-norm Evolution in Neural Nets

"Faithful to What?" On the Limits of Fidelity-Based Explanations

Ablate and Rescue: A Causal Analysis of Residual Stream Hyper-Connections

All in the Head?: A Controlled Study of Component Contributions in Few-Shot NLP

Analysing the Linearity of Linguistic Relations in Language Model Embedding Spaces

Attention Projection Mixing with Exogenous Anchors

Attention Sinks as Internal Signals for Hallucination Detection in Large Language Models

Birkhoff-Exact Hyper-Connections: Exact Spectral Stability for Deep Residual Networks

Configuration-to-Performance Scaling Law with Neural Ansatz

Decoupled Orthogonal Dynamics: Regularization for Deep Network Optimizers

Deriving Hyperparameter Scaling Laws via Modern Optimization Theory

DIAGNOSING FP4 INFERENCE: A LAYER-WISE AND BLOCK-WISE SENSITIVITY ANALYSIS OF NVFP4 AND MXFP4

Divergent Tasks Harm Integration Of New Entities Via Fine-Tuning

Divine Benevolence is an $x^2$: GLUs have asymptotically faster scaling laws than MLPs

Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis

Does Aurora Encode Atmospheric Structure? Latent Regime Analysis and Attribution

Does LLM Pre-Training Typically Occur at the Edge of Stability?

Dropout and the Outliers: Could Transformers Overcome Their Single Points of Failure?

Endogenous Resistance to Activation Steering in Language Models

Entropy-Lens: Uncovering Decision Strategies in LLMs

Evidence Slopes and Effective Dimension in Singular Linear Models

Expert-Data Alignment Governs Generation Quality in Decentralized Diffusion Models

From Growing to Looping: A Unified View of Iterative Computation in LLMs

Generalized Dual-Scale Optimization: Topology-Aware Margin Dynamics in Fine-Grained Vision

Generating output diversity from prompt re-tokenization

Genomic Next-Token Predictors are In-Context Learners

Geometric Properties of Neural Multivariate Regression: An Empirical Study

Geometric Stability of Representation Manifolds as a Training-Free Diagnostic for Studying Data Augmentations

Gradual Stochastic Gradient Descent: from signSGD to SGD via $\ell_p$ Norm

Homophily as a Lossy Channel: Decomposing Information in Graphs and Graph Neural Networks

In-Context Benign Overfitting: A Feature-Selection Model in In-Context Linear Regression

Information spreading in diffusion models from effective field theory

Instruction Following by Principled Attention Boosting of Large Language Models

Is GPU Numerical Noise Really Random? An Empirical Investigation of Floating-Point Error Structure

LAYER-DEPENDENT STRUCTURE IN GRADIENT NOISE OF SMALL CONVOLUTIONAL NETWORKS

Learning When to Be Sparse: Adaptive Activations via Two-Parameter Entropy

Less Data, Faster Training: sampling bias from small dataset can speed up training

Leveraging Low-Rank Structure for Effective Weight-Sharing in Language Models

Masks Can Be Distracting: On Context Comprehension in Diffusion Language Models

Model Evolution Under Zeroth-Order Optimization: A Neural Tangent Kernel Perspective

Multi-Task Pretraining Drives Representational Convergence

Network of Theseus (Like the ship)

Neural Multivariate Regression with Multi-Task Learning and Target Preprocessing

Normalized Conditional Mutual Information Surrogate Loss for Deep Learning Classifiers

On the "Induction Bias" in Sequence Models

On the Complexity of Neural Computation in Superposition

On the Simplicity-Similarity Tradeoff of LoRA and Full Fine-Tuning

Optimal learning rate scaling depends on data in deep scalar linear networks

Optimal scaling laws in learning hierarchical multi-index models

Optimization, Not Architecture, Governs Vision Transformer Generalization in Small-Data Regimes

Pretraining with Masked Backstories in a Toy World

PROBING INFORMATION FLOW IN VISION TRANSFORMERS THROUGH CONTROLLED ATTENTION PERTURBATION

Process-then-Retrieve: A Mechanistic Study of Cross-Modal Alignment in Vision-Language Models

Representation Geometry Mediates Neural Circuit Formation: Evidence from Systematic Regularization Analysis

Revealing Task-Dependent Layer Relevance via Attentive Multi-Layer Fusion

RouterInterp: Understanding Superposed Specialisation in MoE Routing

Scaling-Law Analysis of SignSGD: From Feature-Space Linear Regression to LLM Pre-training

Shared Gradient Discovery and Superposition: Learning Dynamics of Generalization in LLMs

Sharpness-Aware Pretraining Mitigates Catastrophic Forgetting

Simple LLM Baselines are Competitive for Model Diffing

Single-Head Attention in High Dimensions: A Theory of Generalization, Weights Spectra, and Scaling Laws

Skip To The Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs Autoregressive LLM

Soft Gates for Sharp Experts in Tabular Representation Learning

Special solutions with small volume exist

Spherical Cautious Optimizers

Steered LLM Activations are Non-Surjective

STRIDE: Training Data Attribution Can Be Estimated In Activation Space

Sustained Gradient Alignment Mediates Subliminal Learning in a Multi-Step Setting: Evidence from MNIST Auxiliary Logit Distillation Experiment

The Feature-Space Alignment Hypothesis for Neural Network Sparsity

The Offline-Frontier Shift: Diagnosing Distributional Limits in Generative Multi-Objective Optimization

The Role of Data in Model Merging

Thermodynamics of Reinforcement Learning Curricula

To Use or not to Use Muon: How Simplicity Bias in Optimizers Matters

Toy Models of Combinatorial Interpretability

Training for Compositional Sensitivity Reduces Dense Retrieval Generalization

TrasMuon: Trust-Region Adaptive Scaling for Orthogonalized Momentum Optimizers

Understanding Contextual Recall in Transformers: How Finetuning Enables In-Context Reasoning over Pretraining Knowledge

Understanding Learning Dynamics of Zeroth-Order Optimization

Understanding Scaling Laws With Token-Level Analysis

Unified Perspectives on Balancedness and Parameter-norm Evolution in Neural Nets

Vision Language Models Inherit Human Color Perception