ICLR 2026PastMath & reasoning

Workshop on Latent & Implicit Thinking – Going Beyond CoT Reasoning

LIT Workshop @ ICLR 2026

Official website ↗OpenReview venue ↗See all ICLR workshops →✎ Edit this entry

Submission deadline: Feb 9, 2026, 12:00 UTC
OpenReview-synced 2026-02-09 12:00 UTC (as of 2026-06-23) — extensions on OpenReview are applied automatically; verify on the website.
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (78)

Fetched from OpenReview (v2) on 2026-06-10.

ActivationReasoning: Logical Reasoning in Latent Activation Spaces
Lukas Helff, Ruben Härle, Wolfgang Stammer, Felix Friedrich, Manuel Brack, Antonia Wüst, Hikaru Shindo, Patrick Schramowski, Kristian Kersting · PDF
Adaptive Loops and Memory in Transformers: Think Harder or Know More?
Markus Frey, Behzad Shomali, Ali Hamza Bashir, David Berghaus, Joachim Koehler, Mehdi Ali · PDF
All Roads Lead to Rome: Distilling Verifiable Reasoning via Shared Decision Pivots
Dongkyu Cho, Amy B.Z. Zhang, Bilel Fehri, Sheng Wang, Rumi Chunara, Hengrui Cai, Rui Song · PDF
Analyzing and Improving Chain-of-Thought Monitorability Through Information Theory
Usman Anwar, Tim Bakker, Dana Kianfar, Cristina Pinneri, Christos Louizos · PDF
Are Latent Reasoning Models Easily Interpretable?
Connor Dilgren, Sarah Wiegreffe · PDF
Beyond Memorization: Extending Reasoning Depth with Recurrence, Memory and Test-Time Compute Scaling
Ivan Rodkin, Daniil Orel, Konstantin Smirnov, Arman Bolatov, Bilal Elbouardi, Besher Hassan, Yuri Kuratov, Aydar Bulatov, Preslav Nakov, Timothy Baldwin, Artem Shelmanov, Mikhail Burtsev · PDF
Breaking the Reversal Curse in Autoregressive Language Models via Identity Bridge
Xutao Ma, Yixiao Huang, Hanlin Zhu, Somayeh Sojoudi · PDF
Bypassing the Rationale: Causal Auditing of Implicit Reasoning in Language Models
Anish Sathyanarayanan, Aditya Nagarsekar, Aarush Rathore · PDF
Can the Future Inform the Present? Investigating Latent Lookahead Refinement via Multi-Token Prediction
Somesh Mehra, Alejandro Hernández-Cano, Martin Jaggi · PDF
ConFu: Contemplate the Future for Better Speculative Sampling
Zongyue Qin, Raghavv Goel, Risheek Garrepalli, Mukul Gagrani, Mingu Lee, Yizhou Sun · PDF
Cross-Layer Clustering for Stochastic Parameter Decomposition
Saman Seshadri, Jack Digilov, Sean Esla, Nathan Zixia Hu, Michael Ivanitskiy, Pablo Bernabeu-Perez · PDF
Debugging code world models
Babak Rahmani · PDF
Denoising is not the End: Discrete Diffusion Language Models with Self-Correction
Jinwei Zhang, Dimitri von Rütte, Yuhui Ding, Thomas Hofmann · PDF
Discovering Interpretable Algorithms by Decompiling Transformers to RASP
Xinting Huang, Aleksandra Bakalova, Satwik Bhattamishra, William Merrill, Michael Hahn · PDF
Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis
Ferdinand Kapl, Emmanouil Angelis, Tobias Höppe, Kaitlin Maile, Johannes von Oswald, Nino Scherrer, Stefan Bauer · PDF
Dual-Channel Steering: Combining Explicit Prompting and Implicit Parameter Modulation for Reasoning Diversity
Takahito Tanimura, Kotaro Furuya · PDF
Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space
Xingwei Qu, Shaowen Wang, Zihao Huang, Kai Hua, Fan Yin, Jundong Zhou, Qiyang Min, Zihao Wang, Yizhi LI, Tianyu Zhang, He Xing, Zheng Zhang, Yuxuan Song, Tianyu Zheng, Zhiyuan Zeng, Chenghua Lin, Ge Zhang, Wenhao Huang · PDF
Dynamics Within Latent Chain-of-Thought: An Empirical Study of Causal Structure
Zirui Li, Xuefeng Bai, Kehai Chen, Yizhi LI, Jian Yang, Chenghua Lin, Min Zhang · PDF
Emergent Analogy in Transformers
Gouki Minegishi, Jingyuan Feng, Hiroki Furuta, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo · PDF
Encode, Think, Decode: Scaling test-time reasoning with recursive latent thoughts
Yeskendir Koishekenov, Aldo Lipani, Nicola Cancedda · PDF
Energy-Conditioned Thinking: A Three-State Framework for Adaptive Depth and Halting
Ning Coeva · PDF
From Growing to Looping: A Unified View of Iterative Computation in LLMs
Ferdinand Kapl, Emmanouil Angelis, Kaitlin Maile, Johannes von Oswald, Stefan Bauer · PDF
How Do Latent Reasoning Methods Perform Under Weak and Strong Supervision?
Yingqian Cui, Zhenwei Dai, Bing He, Zhan Shi, Hui Liu, Rui Sun, Zhiji Liu, Yue Xing, Jiliang Tang, Benoit Dumoulin · PDF
How to Train Your HRM
Sam Olesker-Taylor, Erika Aranas, Michael Arthur Leopold Pearce, Luke Hudlass-Galley · PDF
Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context
Faris Chaudhry, Siddhant Gadkari · PDF
Inference-Time Rethinking with Latent Thought Vectors for Math Reasoning
Deqian Kong, Minglu Zhao, Aoyang Qin, Bo Pang, Chenxin Tao, David Hartmann, Edouardo Honig, Dehong Xu, Amit H. Kumar, Matthew Sarte, Chuan Li, Jianwen Xie, Ying Nian Wu · PDF
Is continuous CoT better suited for multilingual reasoning?
Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus · PDF
LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation
Gabriele Cesa, Thomas Hehn, Aleix Torres-Camps, Àlex Batlle Casellas, Jordi Ros-Giralt, Arash Behboodi, Tribhuvanesh Orekondy · PDF
LASER: Low-Rank Activation SVD for Efficient Recursion
Ege Çakar, Ketan Raghu, Lia Zheng · PDF
Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning
Lina Berrayana, Ahmed Heakl, Abdullah Sohail, Thomas Hofmann, Salman Khan, Wei Chen · PDF
LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning
Xinwu Ye, Yicheng Mao, Jia Zhang, Yimeng Liu, Li Hao, Fang Wu, Zhiwei Li, Yuxuan Liao, Zehong Wang, Zhiyuan Liu, Zhenfei Yin, Li Yuan, Philip Torr, Huan Sun, xiangxiang Zeng, Mengdi Wang, Le Cong, Shenghua Gao, Xiangru Tang · PDF
Learning Efficient Latent Reasoning with Abstract Chain-of-Thought
Keshav Ramji, Tahira Naseem, Ramón Fernandez Astudillo · PDF
Learning from Partial Chain-of-Thought via Truncated-Reasoning Self-Distillation
Gianluigi Silvestri, Edoardo Cetin · PDF
Learning Multi-step Reasoning via Persistent Latent State Propagation
Yinxi Li, Jiaao Chen, Fang Wu, Jiakai Yu, Heli Qi, Weihao Xuan, Haokai Zhao, Pengyu Nie, Di Jin, Xiangru Tang · PDF
Learning State-Tracking from Code: REPL Traces and Probabilistic Automata
Julien Siems, Riccardo Grazzi, Kirill Kalinin, Hitesh Ballani, Babak Rahmani · PDF
Learning to Execute Graph Algorithms Exactly with Graph Neural Networks
Muhammad Fetrat Qharabagh, Artur Back de Luca, George Giapitzakis, Kimon Fountoulakis · PDF
Lightweight Latent Reasoning for Narrative Tasks
Alexander Gurung, Nikolay Malkin, Mirella Lapata · PDF
LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations
William Lugoloobi, Thomas Foster, William Bankes, Chris Russell · PDF
LOOK BEFORE YOU LEAP: THERMODYNAMIC ARBITRATION OF PARAMETRIC AND NON-PARAMETRIC KNOWLEDGE IN LLM AGENTS VIA SELF-REGULATING MEMORY ARCHITECTURES
Akash Das, Ishan Roy · PDF
Mechanisms of Introspective Awareness
Uzay Macar, Li Yang, Atticus Wang, Peter Wallich, Emmanuel Ameisen, Jack Lindsey · PDF
Mechanistic Analysis Of Universality: Numerical Comparison Circuits Across Transformer Architectures
Arya Bhardia, Julian Ramirez, Siddhanta Verma, Karen Mkrtchyan · PDF
Mechanistic Evidence for Faithfulness Decay in Chain-of-Thought Reasoning
Donald Ye, Max Loffgren, Om Kotadia, Linus Wong, Jonas Rohweder · PDF
MILR: Improving Multimodal Image Generation via Test-Time Latent Reasoning
Yapeng Mi, Yanpeng Zhao, Hengli Li, Chenxi Li, Huimin Wu, Xiaojian Ma, Song-Chun Zhu, Ying Nian Wu, Qing Li · PDF
Modeling Tool Use in Transformers via Computation Oracles
Utkarsh Tiwari, Sai Soumya Nalli, Amit Deshpande · PDF
Offline RL with Hierarchical Action Chunking
Ahad Jawaid · PDF
On the Residual Scaling of Looped Transformers: Stability and Transferability
Shaowen Wang, Bingrui Li, Ge Zhang, Wenhao Huang, Jian Li · PDF
One Step Forward and K Steps Back: Better Reasoning with Denoising Recursion Models
Chris Cameron, Wangzheng Wang, Nikita Ivanov, Ashmita Bhattacharyya, Didier Chételat, Yingxue Zhang · PDF
Parcae: A Dynamical Systems Perspective to Stable Looped LLMs
Hayden Prairie, Zachary Novack, Taylor Berg-Kirkpatrick, Daniel Y Fu · PDF
Polestar-Cache: Reconciling Parallel Decoding and Accuracy in Diffusion LLMs via Token Drift-Aware KV Cache Recalibration
Mingyu Lee, Akshat Ramachandran, Souvik Kundu, Tushar Krishna · PDF
Reasoning Within the Mind: Dynamic Multimodal Interleaving in Latent Space
Chengzhi Liu, Yuzhe YANG, Yue Fan, Qingyue Wei, Sheng Liu, Xin Eric Wang · PDF
RECURRENT-DEPTH VLA: IMPLICIT TEST-TIME COMPUTE SCALING OF VISION–LANGUAGE–ACTION MODELS VIA LATENT ITERATIVE REASONING
Yalcin Tur, Jalal Naghiyev, Haoquan Fang, Wei-Chuan Tsai, Jiafei Duan, Dieter Fox, Ranjay Krishna · PDF
Recursive Reasoning as Attractor Landscape Search: Mechanistic Dynamics of the Tiny Recursive Model
Andreas Efstathiou, Aishwarya Balwani · PDF
Rejection Mixing: Fast Semantic Propagation of Mask Tokens for Efficient DLLM Inference
Yushi Ye, Feng Hong, Huangjie Zheng, Xu Chen, Zhiyong Chen, Yanfeng Wang, Jiangchao Yao · PDF
RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance
Tianlang Chen, Minkai Xu, Jure Leskovec, Stefano Ermon · PDF
SEMIE: Semantic Entropy-Informed Decoding
Benjamin Patrick Evans, Sumitra Ganesh, Leo Ardon · PDF
Single-Position Intervention Fails: Distributed Output Templates Drive In-Context Learning
Bryan Cheng, Jasper Zhang · PDF
T2MLR: Transformer with Temporal Middle-Layer Recurrence
Ziyang Cai, Xingyu Zhu, Yihe Dong, Yinghui He, Sanjeev Arora · PDF
Task-Specific Knowledge Distillation via Intermediate Probes
Ryan Brown, Chris Russell · PDF
Test-Time Meta-Adaptation with Self-Synthesis
Zeyneb N. Kaya, Nick Rui · PDF
The Illusion of Superposition in Latent CoT via Soft Thinking
Michael Rizvi-Martel, Marius Mosbach · PDF
The Mechanistic Invariance Test: Genomic Language Models Fail To Learn Positional Regulatory Logic
Bryan Cheng, Jasper Zhang · PDF
The Power of Power Law: Asymmetry Enables Compositional Reasoning
Zixuan Wang, Xingyu Dang, Jason D. Lee, Kaifeng Lyu · PDF
THINK DEEP, SPEAK ONCE: RELIT, A RECURSIVE LATENT IMPLICIT TRANSFORMER FRAMEWORK
Abhishek Panwar, Maheep Singh, Saksham Bansal · PDF
Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models
Tianyu Fu, Yichen You, Zekai Chen, Guohao Dai, Huazhong Yang, Yu Wang · PDF
Thinking in Latents: Adaptive Anchor Refinement for Implicit Reasoning in LLMs
Disha Sheshanarayana, Rajat Subhra Pal, Manjira Sinha, Tirthankar Dasgupta · PDF
Thinking into the Future: Latent Lookahead Training for Transformers
Lorenzo Noci, Gregor Bachmann, Seyed-Mohsen Moosavi-Dezfooli, Moin Nabi · PDF
Tiny Autoregressive Recursive Models
Paulius Rauba, Claudio Fanconi, Mihaela van der Schaar · PDF
Tiny Recursive Reasoning with Mamba-2 Attention Hybrid
Wenlong Wang, Fergal Reid · PDF
Transformers Provably Learn to Internalize Chain-of-Thought
Yixiao Huang, Hanlin Zhu, Zixuan Wang, Jiantao Jiao, Stuart Russell, Somayeh Sojoudi, Song Mei · PDF
TSLM: Tree-Structured Language Modeling for Divergent Thinking
Doyoung Kim, JaeHyeok Doo, Minjoon Seo · PDF
Ulterior Motives: Detecting Misaligned Reasoning in Continuous Thought Models
Sharan Ramjee · PDF
Variational Latent Reasoning Guided by Rendered Chain-of-Thought
Fanmeng Wang, Haotian Liu, Guojiang Zhao, Hongteng Xu, Zhifeng Gao · PDF
When does Chain-of-Thought Help: A Markovian Perspective
Zihan Wang, Yijun Dong, Qi Lei · PDF
When Intermediate Supervision Doesn’t Help: Evidence from Recurrent CNNs
Elisa Klunder, Guillaume Pourcel, Steven Abreu · PDF
When Pruning Breaks Reasoning: Chain-of-Thought Similarity and Faithfulness in Language Models
AVINASH KUMAR SHARMA, Tushar Shinde · PDF
When Shallow Wins: Silent Failures and the Depth–Accuracy Paradox in Latent Reasoning
Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary · PDF
Which Heads Matter for Reasoning? RL-Guided KV Cache Compression
Wenjie Du, Li Jiang, Keda TAO, Xue Liu, Huan Wang · PDF
ε-Leaf Enumeration: Non-Repeating Self-Consistency via Truncated Tree Search
Xueyan Li, Johannes Zenn, Ekaterina Fadeeva, Guinan Su, Mrinmaya Sachan, Jonas Geiping · PDF

Accepted papers (78)

☆ActivationReasoning: Logical Reasoning in Latent Activation Spaces

☆Adaptive Loops and Memory in Transformers: Think Harder or Know More?

☆All Roads Lead to Rome: Distilling Verifiable Reasoning via Shared Decision Pivots

☆Analyzing and Improving Chain-of-Thought Monitorability Through Information Theory

☆Are Latent Reasoning Models Easily Interpretable?

☆Beyond Memorization: Extending Reasoning Depth with Recurrence, Memory and Test-Time Compute Scaling

☆Breaking the Reversal Curse in Autoregressive Language Models via Identity Bridge

☆Bypassing the Rationale: Causal Auditing of Implicit Reasoning in Language Models

☆Can the Future Inform the Present? Investigating Latent Lookahead Refinement via Multi-Token Prediction

☆ConFu: Contemplate the Future for Better Speculative Sampling

☆Cross-Layer Clustering for Stochastic Parameter Decomposition

☆Debugging code world models

☆Denoising is not the End: Discrete Diffusion Language Models with Self-Correction

☆Discovering Interpretable Algorithms by Decompiling Transformers to RASP

☆Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis

☆Dual-Channel Steering: Combining Explicit Prompting and Implicit Parameter Modulation for Reasoning Diversity

☆Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space

☆Dynamics Within Latent Chain-of-Thought: An Empirical Study of Causal Structure

☆Emergent Analogy in Transformers

☆Encode, Think, Decode: Scaling test-time reasoning with recursive latent thoughts

☆Energy-Conditioned Thinking: A Three-State Framework for Adaptive Depth and Halting

☆From Growing to Looping: A Unified View of Iterative Computation in LLMs

☆How Do Latent Reasoning Methods Perform Under Weak and Strong Supervision?

☆How to Train Your HRM

☆Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

☆Inference-Time Rethinking with Latent Thought Vectors for Math Reasoning

☆Is continuous CoT better suited for multilingual reasoning?

☆LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

☆LASER: Low-Rank Activation SVD for Efficient Recursion

☆Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning

☆LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

☆Learning Efficient Latent Reasoning with Abstract Chain-of-Thought

☆Learning from Partial Chain-of-Thought via Truncated-Reasoning Self-Distillation

☆Learning Multi-step Reasoning via Persistent Latent State Propagation

☆Learning State-Tracking from Code: REPL Traces and Probabilistic Automata

☆Learning to Execute Graph Algorithms Exactly with Graph Neural Networks

☆Lightweight Latent Reasoning for Narrative Tasks

☆LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations

☆LOOK BEFORE YOU LEAP: THERMODYNAMIC ARBITRATION OF PARAMETRIC AND NON-PARAMETRIC KNOWLEDGE IN LLM AGENTS VIA SELF-REGULATING MEMORY ARCHITECTURES

☆Mechanisms of Introspective Awareness

☆Mechanistic Analysis Of Universality: Numerical Comparison Circuits Across Transformer Architectures

☆Mechanistic Evidence for Faithfulness Decay in Chain-of-Thought Reasoning

☆MILR: Improving Multimodal Image Generation via Test-Time Latent Reasoning

☆Modeling Tool Use in Transformers via Computation Oracles

☆Offline RL with Hierarchical Action Chunking

☆On the Residual Scaling of Looped Transformers: Stability and Transferability

☆One Step Forward and K Steps Back: Better Reasoning with Denoising Recursion Models

☆Parcae: A Dynamical Systems Perspective to Stable Looped LLMs

☆Polestar-Cache: Reconciling Parallel Decoding and Accuracy in Diffusion LLMs via Token Drift-Aware KV Cache Recalibration

☆Reasoning Within the Mind: Dynamic Multimodal Interleaving in Latent Space

☆RECURRENT-DEPTH VLA: IMPLICIT TEST-TIME COMPUTE SCALING OF VISION–LANGUAGE–ACTION MODELS VIA LATENT ITERATIVE REASONING

☆Recursive Reasoning as Attractor Landscape Search: Mechanistic Dynamics of the Tiny Recursive Model

☆Rejection Mixing: Fast Semantic Propagation of Mask Tokens for Efficient DLLM Inference

☆RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance

☆SEMIE: Semantic Entropy-Informed Decoding

☆Single-Position Intervention Fails: Distributed Output Templates Drive In-Context Learning

☆T2MLR: Transformer with Temporal Middle-Layer Recurrence

☆Task-Specific Knowledge Distillation via Intermediate Probes

☆Test-Time Meta-Adaptation with Self-Synthesis

☆The Illusion of Superposition in Latent CoT via Soft Thinking

☆The Mechanistic Invariance Test: Genomic Language Models Fail To Learn Positional Regulatory Logic

☆The Power of Power Law: Asymmetry Enables Compositional Reasoning

☆THINK DEEP, SPEAK ONCE: RELIT, A RECURSIVE LATENT IMPLICIT TRANSFORMER FRAMEWORK

☆Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

☆Thinking in Latents: Adaptive Anchor Refinement for Implicit Reasoning in LLMs

☆Thinking into the Future: Latent Lookahead Training for Transformers

☆Tiny Autoregressive Recursive Models

☆Tiny Recursive Reasoning with Mamba-2 Attention Hybrid

☆Transformers Provably Learn to Internalize Chain-of-Thought

☆TSLM: Tree-Structured Language Modeling for Divergent Thinking

☆Ulterior Motives: Detecting Misaligned Reasoning in Continuous Thought Models

☆Variational Latent Reasoning Guided by Rendered Chain-of-Thought

☆When does Chain-of-Thought Help: A Markovian Perspective

☆When Intermediate Supervision Doesn’t Help: Evidence from Recurrent CNNs

☆When Pruning Breaks Reasoning: Chain-of-Thought Similarity and Faithfulness in Language Models

☆When Shallow Wins: Silent Failures and the Depth–Accuracy Paradox in Latent Reasoning

☆Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

☆ε-Leaf Enumeration: Non-Repeating Self-Consistency via Truncated Tree Search

ActivationReasoning: Logical Reasoning in Latent Activation Spaces

Adaptive Loops and Memory in Transformers: Think Harder or Know More?

All Roads Lead to Rome: Distilling Verifiable Reasoning via Shared Decision Pivots

Analyzing and Improving Chain-of-Thought Monitorability Through Information Theory

Are Latent Reasoning Models Easily Interpretable?

Beyond Memorization: Extending Reasoning Depth with Recurrence, Memory and Test-Time Compute Scaling

Breaking the Reversal Curse in Autoregressive Language Models via Identity Bridge

Bypassing the Rationale: Causal Auditing of Implicit Reasoning in Language Models

Can the Future Inform the Present? Investigating Latent Lookahead Refinement via Multi-Token Prediction

ConFu: Contemplate the Future for Better Speculative Sampling

Cross-Layer Clustering for Stochastic Parameter Decomposition

Debugging code world models

Denoising is not the End: Discrete Diffusion Language Models with Self-Correction

Discovering Interpretable Algorithms by Decompiling Transformers to RASP

Do Depth-Grown Models Overcome the Curse of Depth? An In-Depth Analysis

Dual-Channel Steering: Combining Explicit Prompting and Implicit Parameter Modulation for Reasoning Diversity

Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space

Dynamics Within Latent Chain-of-Thought: An Empirical Study of Causal Structure

Emergent Analogy in Transformers

Encode, Think, Decode: Scaling test-time reasoning with recursive latent thoughts

Energy-Conditioned Thinking: A Three-State Framework for Adaptive Depth and Halting

From Growing to Looping: A Unified View of Iterative Computation in LLMs

How Do Latent Reasoning Methods Perform Under Weak and Strong Supervision?

How to Train Your HRM

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

Inference-Time Rethinking with Latent Thought Vectors for Math Reasoning

Is continuous CoT better suited for multilingual reasoning?

LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

LASER: Low-Rank Activation SVD for Efficient Recursion

Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

Learning Efficient Latent Reasoning with Abstract Chain-of-Thought

Learning from Partial Chain-of-Thought via Truncated-Reasoning Self-Distillation

Learning Multi-step Reasoning via Persistent Latent State Propagation

Learning State-Tracking from Code: REPL Traces and Probabilistic Automata

Learning to Execute Graph Algorithms Exactly with Graph Neural Networks

Lightweight Latent Reasoning for Narrative Tasks

LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations

LOOK BEFORE YOU LEAP: THERMODYNAMIC ARBITRATION OF PARAMETRIC AND NON-PARAMETRIC KNOWLEDGE IN LLM AGENTS VIA SELF-REGULATING MEMORY ARCHITECTURES

Mechanisms of Introspective Awareness

Mechanistic Analysis Of Universality: Numerical Comparison Circuits Across Transformer Architectures

Mechanistic Evidence for Faithfulness Decay in Chain-of-Thought Reasoning

MILR: Improving Multimodal Image Generation via Test-Time Latent Reasoning

Modeling Tool Use in Transformers via Computation Oracles

Offline RL with Hierarchical Action Chunking

On the Residual Scaling of Looped Transformers: Stability and Transferability

One Step Forward and K Steps Back: Better Reasoning with Denoising Recursion Models

Parcae: A Dynamical Systems Perspective to Stable Looped LLMs

Polestar-Cache: Reconciling Parallel Decoding and Accuracy in Diffusion LLMs via Token Drift-Aware KV Cache Recalibration

Reasoning Within the Mind: Dynamic Multimodal Interleaving in Latent Space

RECURRENT-DEPTH VLA: IMPLICIT TEST-TIME COMPUTE SCALING OF VISION–LANGUAGE–ACTION MODELS VIA LATENT ITERATIVE REASONING

Recursive Reasoning as Attractor Landscape Search: Mechanistic Dynamics of the Tiny Recursive Model

Rejection Mixing: Fast Semantic Propagation of Mask Tokens for Efficient DLLM Inference

RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance

SEMIE: Semantic Entropy-Informed Decoding

Single-Position Intervention Fails: Distributed Output Templates Drive In-Context Learning

T2MLR: Transformer with Temporal Middle-Layer Recurrence

Task-Specific Knowledge Distillation via Intermediate Probes

Test-Time Meta-Adaptation with Self-Synthesis

The Illusion of Superposition in Latent CoT via Soft Thinking

The Mechanistic Invariance Test: Genomic Language Models Fail To Learn Positional Regulatory Logic

The Power of Power Law: Asymmetry Enables Compositional Reasoning

THINK DEEP, SPEAK ONCE: RELIT, A RECURSIVE LATENT IMPLICIT TRANSFORMER FRAMEWORK

Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

Thinking in Latents: Adaptive Anchor Refinement for Implicit Reasoning in LLMs

Thinking into the Future: Latent Lookahead Training for Transformers

Tiny Autoregressive Recursive Models

Tiny Recursive Reasoning with Mamba-2 Attention Hybrid

Transformers Provably Learn to Internalize Chain-of-Thought

TSLM: Tree-Structured Language Modeling for Divergent Thinking

Ulterior Motives: Detecting Misaligned Reasoning in Continuous Thought Models

Variational Latent Reasoning Guided by Rendered Chain-of-Thought

When does Chain-of-Thought Help: A Markovian Perspective

When Intermediate Supervision Doesn’t Help: Evidence from Recurrent CNNs

When Pruning Breaks Reasoning: Chain-of-Thought Similarity and Faithfulness in Language Models

When Shallow Wins: Silent Failures and the Depth–Accuracy Paradox in Latent Reasoning

Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

ε-Leaf Enumeration: Non-Repeating Self-Consistency via Truncated Tree Search