NeurIPS 2024PastOther

NeurIPS 2024 Workshop on Fine-Tuning in Modern Machine Learning: Principles and Scalability

FITML 2024

Official website ↗OpenReview venue ↗See all NeurIPS workshops →✎ Edit this entry

Submission deadline: Oct 1, 2024, 23:59 UTC
imported from OpenReview — check the website for extensions
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (88)

Fetched from OpenReview (v2) on 2026-06-10.

A Layer Selection Approach to Test Time Adaptation
Sabyasachi Sahoo, Mostafa ElAraby, Jonas Ngnawe, Yann Batiste Pequignot, Frederic Precioso, Christian Gagné · PDF
A Tensor-based Convolutional Neural Network for Small Dataset Classification
Zhenhua Chen, David J. Crandall · PDF
Accelerating Direct Preference Optimization with Prefix Sharing
Franklin Wang, Sumanth Hegde · PDF
ActNAS : Generating Efficient YOLO Models using Activation NAS
Sudhakar Sah, Ravish Kumar, Darshan C Ganji, Ehsan Saboori · PDF
Adapting Language Models via Token Translation
Zhili Feng, Tanya Marwah, Nicolo Fusi, David Alvarez-Melis, Lester Mackey · PDF
Addax: Utilizing Zeroth-Order Gradients to Improve Memory Efficiency and Performance of SGD for Fine-Tuning Language Models
Zeman Li, Xinwei Zhang, Peilin Zhong, Yuan Deng, Meisam Razaviyayn, Vahab Mirrokni · PDF
An empirical study of CLIP fine-tuning with similarity clusters
Shixuan Liu, Yiwei Lyu, Honglak Lee, Todd C Hollon · PDF
Analysing Softmax Entropy Minimization for Adaptating Multitask Models at Test-time
Soumyajit Chatterjee, Abhirup Ghosh, Fahim Kawsar, Mohammad Malekzadeh · PDF
Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs
Yung-Chieh Chan, George Pu, Apaar Shanker, Parth Suresh, Penn Jenks, John Heyer, Samuel Marc Denton · PDF
Best Unpacking DPO and PPO: Disentangling Practices for Learning from Preference Feedback
Hamish Ivison, Yizhong Wang, Jiacheng Liu, Zeqiu Wu, Valentina Pyatkin, Nathan Lambert, Noah A. Smith, Yejin Choi, Hannaneh Hajishirzi · PDF
Characterizing the Training Dynamics of Private Fine-tuning with Langevin diffusion
Shuqi Ke, Charlie Hou, Sewoong Oh, Giulia Fanti · PDF
COMAL: A Convergent Meta-Algorithm for Aligning LLMs with General Preferences
Yixin Liu, Argyris Oikonomou, Weiqiang Zheng, Yang Cai, Arman Cohan · PDF
Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization
Hritik Bansal, Ashima Suvarna, Gantavya Bhatt, Nanyun Peng, Kai-Wei Chang, Aditya Grover · PDF
CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation
Ingo Ziegler, Abdullatif Köksal, Desmond Elliott, Hinrich Schuetze · PDF
Deep Reinforcement Learning Without Experience Replay, Target Networks, or Batch Updates
Mohamed Elsayed, Gautham Vasan, A. Rupam Mahmood · PDF
Discrepancy-Guided Parameter Suppression for Robust Fine-tuning
Chang Liu, Jingyu Ma · PDF
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agent
Taiyi Wang, Zhihao Wu, Jianheng Liu, Derek Yuen, Jianye HAO, Jun Wang, Kun Shao · PDF
E-Tamba: Efficient Transformer-Mamba Layer Transplantation
DAZHI PENG, Hangrui Cao · PDF
Early Exiting in Deep Neural Networks via Dirichlet-based Uncertainty Quantification
Feng Xia, Jake Snell, Thomas L. Griffiths · PDF
Effective Text-to-Image Alignment with Quality Aware Pair Ranking
Kunal Singh, Mukund Khanna, Pradeep Moturi · PDF
Efficient Fine-Tuning of Behavior Cloned Policies with Reinforcement Learning from Limited Demonstrations
Samyeul Noh, Seonghyun Kim, Ingook Jang · PDF
Efficiently Learning at Test-Time: Active Fine-Tuning of LLMs
Jonas Hübotter, Sascha Bongni, Ido Hakimi, Andreas Krause · PDF
Enhancing Cross-Language Code Translation via Task-Specific Embedding Alignment in Retrieval-Augmented Generation
Manish Bhattarai, Javier E. Santos, Ismael Boureima, Daniel O'Malley · PDF
Ensembling Finetuned Language Models for Text Classification
Sebastian Pineda Arango, Maciej Janowski, Lennart Purucker, Arber Zela, Frank Hutter, Josif Grabocka · PDF
Entropic Distribution Matching for Supervised Fine-tuning of LLMs: Less Overfitting and Better Diversity
Ziniu Li, Congliang Chen, Tian Xu, Zeyu Qin, Jiancong Xiao, Ruoyu Sun, Zhi-Quan Luo · PDF
Evaluating Fine-Tuning Efficiency of Human-Inspired Learning Strategies in Medical Question Answering
Yushi Yang, Andrew Michael Bean, Robert McCraith, Adam Mahdi · PDF
Exploring Continual Fine-Tuning for Enhancing Language Ability in Large Language Model
Divyanshu Aggarwal, Sankarshan Damle, Navin Goyal, Satya Lokam, Sunayana Sitaram · PDF
Faster, More Efficient RLHF through Off-Policy Asynchronous Learning
Michael Noukhovitch, Shengyi Huang, Sophie Xhonneux, Arian Hosseini, Rishabh Agarwal, Aaron Courville · PDF
FedEx-LoRA: Exact Aggregation for Federated Parameter-Efficient Fine-Tuning of Foundation Models
Raghav Singhal, Kaustubh Ponkshe, Praneeth Vepakomma · PDF
Fine tuning language models to align fidelity and efficiency of generative retrieval in multi-turn dialogues
Jeremy Curuksu · PDF
Fine-tuning Vision Classifiers On A Budget
Sunil Kumar, Ted Sandler, Paulina Varshavskaya · PDF
Fitness Aware Human Motion Generation with Fine-Tuning
Kiril Bikov, Shiye Su, Deepro Choudhury, Zhilin Guo, Weihao Xia, Mehmet Salih Çeliktenyıldız, Chenliang Zhou, Param Hanji, Cengiz Oztireli · PDF
Flat-LoRA: Low-Rank Adaption over a Flat Loss Landscape
Tao Li, Zhengbao He, Yujun Li, Yasheng Wang, Lifeng Shang, Xiaolin Huang · PDF
Flexora: Flexible Low-Rank Adaptation for Large Language Models
Chenxing Wei, Yao Shu, Ying Tiffany He, Fei Yu · PDF
FourierKAN outperforms MLP on Text Classification Head Fine-tuning
Abdullah Al Imran, Md Farhan Ishmam · PDF
FRACTAL: Fine-Grained Scoring from Aggregate Text Labels
Yukti Makhija, Priyanka Agrawal, Rishi Saket, Aravindan Raghuveer · PDF
GaLore-mini: Low Rank Gradient Learning with Fewer Learning Rates
Weihao Huang, Zhenyu Zhang, Yushun Zhang, Zhi-Quan Luo, Ruoyu Sun, Zhangyang Wang · PDF
Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization
Haoyuan Sun, Bo Xia, Yongzhe Chang, Xueqian Wang · PDF
Hierarchical Unlearning Framework for Multi-Class Classification
Abraham Chan, Arpan Gujarati, Karthik Pattabiraman, Sathish Gopalakrishnan · PDF
HyperDPO: Conditioned One-Shot Multi-Objective Fine-Tuning Framework
Yinuo Ren, Tesi Xiao, Michael Shavlovsky, Lexing Ying, Holakou Rahmanian · PDF
ImageNet-RIB Benchmark: Large Pre-Training Datasets Don't Guarantee Robustness after Fine-Tuning
Jaedong Hwang, Brian Cheung, Zhang-Wei Hong, Akhilan Boopathy, Pulkit Agrawal, Ila R Fiete · PDF
Improving Fine-Tuning with Latent Cluster Correction
Cédric Ho Thanh · PDF
Improving LLM Generation with Inverse and Forward Alignment: Reward Modeling, Prompting, Fine-Tuning, and Inference-Time Optimization
Hao Sun, Thomas Pouplin, Nicolás Astorga, Tennison Liu, Mihaela van der Schaar · PDF
Inconsistencies In Consistency Models: Better ODE Solving Does Not Imply Better Samples
Noël Vouitsis, Rasa Hosseinzadeh, Brendan Leigh Ross, Valentin Villecroze, Satya Krishna Gorti, Jesse C. Cresswell, Gabriel Loaiza-Ganem · PDF
Inducing Semi-Structured Sparsity by Masking for Efficient Model Inference in Convolutional Networks
David Danhofer · PDF
Instant Transformer Adaption via HyperLoRA
Rujikorn Charakorn, Edoardo Cetin, Yujin Tang, Robert Tjarko Lange · PDF
Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning
Simran Kaur, Simon Park, Anirudh Goyal, Sanjeev Arora · PDF
Investigating the Role of Fine-Tuning in Addressing the Gap Between Synthetic and Real Data in Generative Foundation Models
Leonhard Hennicke, Christian Medeiros Adriano, Holger Giese, Lukas Schott, Jan Mathias Koehler · PDF
Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment
Chenliang Li, Siliang Zeng, Zeyi Liao, Jiaxiang Li, Dongyeop Kang, Alfredo Garcia, Mingyi Hong · PDF
Learning the Regularization Strength for Deep Fine-Tuning via a Data-Emphasized Variational Objective
Ethan Harvey, Mikhail Petrov, Michael C Hughes · PDF
LLM Alignment Through Successive Policy Re-weighting (SPR)
Xinnan Zhang, Siliang Zeng, Jiaxiang Li, Kaixiang Lin, Mingyi Hong · PDF
Mastering Task Arithmetic: $\tau$Jp as a Key Indicator for Weight Disentanglement
Kotaro Yoshida, Yuji Naraki, Takafumi Horie, Ryosuke Yamaki, Ryotaro Shimizu, Yuki Saito, Julian McAuley, Hiroki Naganuma · PDF
Memory retaining finetuning via distillation
Zitong Yang, Aonan Zhang, Sam Wiseman, Xiang Kong, Ke Ye, Dong Yin · PDF
Model Soup for Better RLHF: Weight Space Averaging to Improve Alignment in LLMs
Atoosa Chegini, Hamid Kazemi, Seyed Iman Mirzadeh, Dong Yin, Maxwell Horton, Moin Nabi, Mehrdad Farajtabar, Keivan Alizadeh · PDF
MPLoRA: Orthogonal Multi-Path Low-Rank Adaptation for Parameter Efficient Fine-Tuning
Junhan Shi, Fulin Wang, Qing Li, Yong Jiang · PDF
Navigating Parameter Space with Geodesic Interpolation: A New Approach to Efficient Fine-Tuning
Sophia Abraham · PDF
Noise Stability Optimization for Finding Flat Minima: A Hessian-based Regularization Approach
Hongyang R. Zhang, Dongyue Li, Zhenshuo Zhang · PDF
On Efficient Distillation from LLMs to SLMs
Metod Jazbec, Menglin Xia, Ankur Mallick, Daniel Madrigal, Dongge Han, Samuel Kessler, Victor Rühle · PDF
On the Transferability of Parameter-Efficient Continual Learning for Vision Transformers
Leon Ackermann, Van-Linh Nguyen · PDF
One Initialization to Rule them All: Fine-tuning via Explained Variance Adaptation
Fabian Paischer, Lukas Hauzenberger, Thomas Schmied, Benedikt Alkin, Marc Peter Deisenroth, Sepp Hochreiter · PDF
Online Fine-Tuning with Uncertainty Quantification for Offline Pre-Trained Agents
Ingook Jang, Seonghyun Kim, Samyeul Noh · PDF
Optimizing Small Language Models for In-Vehicle Function-Calling
YAHYA SOWTI KHIABANI, Farris Atif, Chieh Hsu, Sven Stahlmann, Tobias Michels, Sebastian Kramer, Benedikt Heidrich, M. Saquib Sarfraz, Julian Merten, Faezeh Tafazzoli · PDF
PAL: Pluralistic Alignment Framework for Learning from Heterogeneous Preferences
Daiwei Chen, Yi Chen, Aniket Rege, Ramya Korlakai Vinayak · PDF
Parameter-Efficient Fine-Tuning of State Space Models
Kevin Galim, Wonjun Kang, Yuchen Zeng, Hyung Il Koo, Kangwook Lee · PDF
Parasite Networks: Transfer Learning in Resource-Constrained Domains
Andrew Alini, Douglas E. Sturim, Kevin Brady, Pooya Khorrami · PDF
REACT: Residual-Adaptive Contextual Tuning for Fast Model Adaptation in Cybersecurity
Jiayun Zhang, Junshen Xu, Yi Fan · PDF
RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates
Md Kowsher, Tara Esmaeilbeig, Chun-Nam Yu, Mojtaba Soltanalian, Niloofar Yousefi · PDF
Scalability of memorization-based machine unlearning
Kairan Zhao, Peter Triantafillou · PDF
Self-Stitching: Widely Applicable and Efficient Transfer Learning Using Stitching Layer
Tanachai Anakewat, YUSUKE Mukuta, Thomas Westfechtel, Tatsuya Harada · PDF
Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition
Mariia Drozdova, Vitaliy Kinakh, Yury Belousov, Erica Lastufka, Slava Voloshynovskiy · PDF
Sharp Analysis for KL-Regularized Contextual Bandits and RLHF
Heyang Zhao, Chenlu Ye, Quanquan Gu, Tong Zhang · PDF
Simultaneous Weight and Architecture Optimization for Neural Networks
Zitong Huang, Mansooreh Montazerin, Ajitesh Srivastava · PDF
Skip Transformers: Efficient Inference through Skip-Routing
Matthew Peroni, Dimitris Bertsimas · PDF
SVFT: Parameter-Efficient Fine-Tuning with Singular Vectors
Vijay Lingam, Atula Tejaswi, Aditya Vavre, Aneesh Shetty, Gautham Krishna Gudur, Joydeep Ghosh, Alex Dimakis, Eunsol Choi, Aleksandar Bojchevski, Sujay Sanghavi · PDF
Teaching LLMs How To Learn with Contextual Fine-Tuning
Younwoo Choi, Muhammad Adil Asif, Ziwen Han, John Willes, Rahul Krishnan · PDF
Token Pruning using a Lightweight Background Aware Vision Transformer
Sudhakar Sah, Ravish Kumar, Honnesh Rohmetra, Ehsan Saboori · PDF
TOU: Truncated-factorized reduction for an efficient-parameter model fine-tuning
Phuong Thi-Mai Nguyen, Minh-Son Dao, Koji Zettsu · PDF
Towards Long-Context Time Series Foundation Models With A Handful Of Additional Parameters
Nina Żukowska, Mononito Goswami, Michał Wiliński, Willa Potosnak, Artur Dubrawski · PDF
Towards Natural Machine Unlearning
Zhengbao He, Tao Li, Xinwen Cheng, Zhehao Huang, Xiaolin Huang · PDF
TreeTop: Topology-Aware Fine-Tuning for LLM Conversation Tree Understanding
Jashn Arora, Rahul Madhavan, Karthikeyan Shanmugam, John Palowitch, Manish Jain · PDF
Uncertainty-Penalized Direct Preference Optimization
Sam Houliston, Alizée Pace, Alexander Immer, Gunnar Ratsch · PDF
Understanding Visual Concepts Across Models
Brandon Trabucco, Max A Gurinas, Kyle Doherty, Russ Salakhutdinov · PDF
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization
Noam Razin, Sadhika Malladi, Adithya Bhaskar, Danqi Chen, Sanjeev Arora, Boris Hanin · PDF
UnoLoRA: Single Low-Rank Adaptation for Efficient Multitask Fine-tuning
Akash Kamalesh, Anirudh Lakhotia, Nischal H S, Prerana Sanjay Kulkarni, Gowri Srinivasa · PDF
Variational Best-of-N Alignment
Afra Amini, Tim Vieira, Elliott Ash, Ryan Cotterell · PDF
Variational Low-Rank Adaptation Using IVON
Bai Cong, Nico Daheim, Yuesong Shen, Daniel Cremers, Rio Yokota, Mohammad Emtiyaz Khan, Thomas Möllenhoff · PDF
What Causes a Disparate Impact in a Quantized Model?
Abhimanyu Bellam, Jung-Eun Kim · PDF
XoRA: Expander Adapted LoRA Finetuning
Amaljith EV, Arindam Biswas, Suryam Arnav Kalra, Pabitra Mitra, BISWAJIT BASU · PDF

Accepted papers (88)

☆A Layer Selection Approach to Test Time Adaptation

☆A Tensor-based Convolutional Neural Network for Small Dataset Classification

☆Accelerating Direct Preference Optimization with Prefix Sharing

☆ActNAS : Generating Efficient YOLO Models using Activation NAS

☆Adapting Language Models via Token Translation

☆Addax: Utilizing Zeroth-Order Gradients to Improve Memory Efficiency and Performance of SGD for Fine-Tuning Language Models

☆An empirical study of CLIP fine-tuning with similarity clusters

☆Analysing Softmax Entropy Minimization for Adaptating Multitask Models at Test-time

☆Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs

☆Best Unpacking DPO and PPO: Disentangling Practices for Learning from Preference Feedback

☆Characterizing the Training Dynamics of Private Fine-tuning with Langevin diffusion

☆COMAL: A Convergent Meta-Algorithm for Aligning LLMs with General Preferences

☆Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization

☆CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation

☆Deep Reinforcement Learning Without Experience Replay, Target Networks, or Batch Updates

☆Discrepancy-Guided Parameter Suppression for Robust Fine-tuning

☆DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agent

☆E-Tamba: Efficient Transformer-Mamba Layer Transplantation

☆Early Exiting in Deep Neural Networks via Dirichlet-based Uncertainty Quantification

☆Effective Text-to-Image Alignment with Quality Aware Pair Ranking

☆Efficient Fine-Tuning of Behavior Cloned Policies with Reinforcement Learning from Limited Demonstrations

☆Efficiently Learning at Test-Time: Active Fine-Tuning of LLMs

☆Enhancing Cross-Language Code Translation via Task-Specific Embedding Alignment in Retrieval-Augmented Generation

☆Ensembling Finetuned Language Models for Text Classification

☆Entropic Distribution Matching for Supervised Fine-tuning of LLMs: Less Overfitting and Better Diversity

☆Evaluating Fine-Tuning Efficiency of Human-Inspired Learning Strategies in Medical Question Answering

☆Exploring Continual Fine-Tuning for Enhancing Language Ability in Large Language Model

☆Faster, More Efficient RLHF through Off-Policy Asynchronous Learning

☆FedEx-LoRA: Exact Aggregation for Federated Parameter-Efficient Fine-Tuning of Foundation Models

☆Fine tuning language models to align fidelity and efficiency of generative retrieval in multi-turn dialogues

☆Fine-tuning Vision Classifiers On A Budget

☆Fitness Aware Human Motion Generation with Fine-Tuning

☆Flat-LoRA: Low-Rank Adaption over a Flat Loss Landscape

☆Flexora: Flexible Low-Rank Adaptation for Large Language Models

☆FourierKAN outperforms MLP on Text Classification Head Fine-tuning

☆FRACTAL: Fine-Grained Scoring from Aggregate Text Labels

☆GaLore-mini: Low Rank Gradient Learning with Fewer Learning Rates

☆Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization

☆Hierarchical Unlearning Framework for Multi-Class Classification

☆HyperDPO: Conditioned One-Shot Multi-Objective Fine-Tuning Framework

☆ImageNet-RIB Benchmark: Large Pre-Training Datasets Don't Guarantee Robustness after Fine-Tuning

☆Improving Fine-Tuning with Latent Cluster Correction

☆Improving LLM Generation with Inverse and Forward Alignment: Reward Modeling, Prompting, Fine-Tuning, and Inference-Time Optimization

☆Inconsistencies In Consistency Models: Better ODE Solving Does Not Imply Better Samples

☆Inducing Semi-Structured Sparsity by Masking for Efficient Model Inference in Convolutional Networks

☆Instant Transformer Adaption via HyperLoRA

☆Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning

☆Investigating the Role of Fine-Tuning in Addressing the Gap Between Synthetic and Real Data in Generative Foundation Models

☆Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment

☆Learning the Regularization Strength for Deep Fine-Tuning via a Data-Emphasized Variational Objective

☆LLM Alignment Through Successive Policy Re-weighting (SPR)

☆Mastering Task Arithmetic: $\tau$Jp as a Key Indicator for Weight Disentanglement

☆Memory retaining finetuning via distillation

☆Model Soup for Better RLHF: Weight Space Averaging to Improve Alignment in LLMs

☆MPLoRA: Orthogonal Multi-Path Low-Rank Adaptation for Parameter Efficient Fine-Tuning

☆Navigating Parameter Space with Geodesic Interpolation: A New Approach to Efficient Fine-Tuning

☆Noise Stability Optimization for Finding Flat Minima: A Hessian-based Regularization Approach

☆On Efficient Distillation from LLMs to SLMs

☆On the Transferability of Parameter-Efficient Continual Learning for Vision Transformers

☆One Initialization to Rule them All: Fine-tuning via Explained Variance Adaptation

☆Online Fine-Tuning with Uncertainty Quantification for Offline Pre-Trained Agents

☆Optimizing Small Language Models for In-Vehicle Function-Calling

☆PAL: Pluralistic Alignment Framework for Learning from Heterogeneous Preferences

☆Parameter-Efficient Fine-Tuning of State Space Models

☆Parasite Networks: Transfer Learning in Resource-Constrained Domains

☆REACT: Residual-Adaptive Contextual Tuning for Fast Model Adaptation in Cybersecurity

☆RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates

☆Scalability of memorization-based machine unlearning

☆Self-Stitching: Widely Applicable and Efficient Transfer Learning Using Stitching Layer

☆Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition

☆Sharp Analysis for KL-Regularized Contextual Bandits and RLHF

☆Simultaneous Weight and Architecture Optimization for Neural Networks

☆Skip Transformers: Efficient Inference through Skip-Routing

☆SVFT: Parameter-Efficient Fine-Tuning with Singular Vectors

☆Teaching LLMs How To Learn with Contextual Fine-Tuning

☆Token Pruning using a Lightweight Background Aware Vision Transformer

☆TOU: Truncated-factorized reduction for an efficient-parameter model fine-tuning

☆Towards Long-Context Time Series Foundation Models With A Handful Of Additional Parameters

☆Towards Natural Machine Unlearning

A Layer Selection Approach to Test Time Adaptation

A Tensor-based Convolutional Neural Network for Small Dataset Classification

Accelerating Direct Preference Optimization with Prefix Sharing

ActNAS : Generating Efficient YOLO Models using Activation NAS

Adapting Language Models via Token Translation

Addax: Utilizing Zeroth-Order Gradients to Improve Memory Efficiency and Performance of SGD for Fine-Tuning Language Models

An empirical study of CLIP fine-tuning with similarity clusters

Analysing Softmax Entropy Minimization for Adaptating Multitask Models at Test-time

Balancing Cost and Effectiveness of Synthetic Data Generation Strategies for LLMs

Best Unpacking DPO and PPO: Disentangling Practices for Learning from Preference Feedback

Characterizing the Training Dynamics of Private Fine-tuning with Langevin diffusion

COMAL: A Convergent Meta-Algorithm for Aligning LLMs with General Preferences

Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization

CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation

Deep Reinforcement Learning Without Experience Replay, Target Networks, or Batch Updates

Discrepancy-Guided Parameter Suppression for Robust Fine-tuning

DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agent

E-Tamba: Efficient Transformer-Mamba Layer Transplantation

Early Exiting in Deep Neural Networks via Dirichlet-based Uncertainty Quantification

Effective Text-to-Image Alignment with Quality Aware Pair Ranking

Efficient Fine-Tuning of Behavior Cloned Policies with Reinforcement Learning from Limited Demonstrations

Efficiently Learning at Test-Time: Active Fine-Tuning of LLMs

Enhancing Cross-Language Code Translation via Task-Specific Embedding Alignment in Retrieval-Augmented Generation

Ensembling Finetuned Language Models for Text Classification

Entropic Distribution Matching for Supervised Fine-tuning of LLMs: Less Overfitting and Better Diversity

Evaluating Fine-Tuning Efficiency of Human-Inspired Learning Strategies in Medical Question Answering

Exploring Continual Fine-Tuning for Enhancing Language Ability in Large Language Model

Faster, More Efficient RLHF through Off-Policy Asynchronous Learning

FedEx-LoRA: Exact Aggregation for Federated Parameter-Efficient Fine-Tuning of Foundation Models

Fine tuning language models to align fidelity and efficiency of generative retrieval in multi-turn dialogues

Fine-tuning Vision Classifiers On A Budget

Fitness Aware Human Motion Generation with Fine-Tuning

Flat-LoRA: Low-Rank Adaption over a Flat Loss Landscape

Flexora: Flexible Low-Rank Adaptation for Large Language Models

FourierKAN outperforms MLP on Text Classification Head Fine-tuning

FRACTAL: Fine-Grained Scoring from Aggregate Text Labels

GaLore-mini: Low Rank Gradient Learning with Fewer Learning Rates

Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization

Hierarchical Unlearning Framework for Multi-Class Classification

HyperDPO: Conditioned One-Shot Multi-Objective Fine-Tuning Framework

ImageNet-RIB Benchmark: Large Pre-Training Datasets Don't Guarantee Robustness after Fine-Tuning

Improving Fine-Tuning with Latent Cluster Correction

Improving LLM Generation with Inverse and Forward Alignment: Reward Modeling, Prompting, Fine-Tuning, and Inference-Time Optimization

Inconsistencies In Consistency Models: Better ODE Solving Does Not Imply Better Samples

Inducing Semi-Structured Sparsity by Masking for Efficient Model Inference in Convolutional Networks

Instant Transformer Adaption via HyperLoRA

Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning

Investigating the Role of Fine-Tuning in Addressing the Gap Between Synthetic and Real Data in Generative Foundation Models

Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment

Learning the Regularization Strength for Deep Fine-Tuning via a Data-Emphasized Variational Objective

LLM Alignment Through Successive Policy Re-weighting (SPR)

Mastering Task Arithmetic: $\tau$Jp as a Key Indicator for Weight Disentanglement

Memory retaining finetuning via distillation

Model Soup for Better RLHF: Weight Space Averaging to Improve Alignment in LLMs

MPLoRA: Orthogonal Multi-Path Low-Rank Adaptation for Parameter Efficient Fine-Tuning

Navigating Parameter Space with Geodesic Interpolation: A New Approach to Efficient Fine-Tuning

Noise Stability Optimization for Finding Flat Minima: A Hessian-based Regularization Approach

On Efficient Distillation from LLMs to SLMs

On the Transferability of Parameter-Efficient Continual Learning for Vision Transformers

One Initialization to Rule them All: Fine-tuning via Explained Variance Adaptation

Online Fine-Tuning with Uncertainty Quantification for Offline Pre-Trained Agents

Optimizing Small Language Models for In-Vehicle Function-Calling

PAL: Pluralistic Alignment Framework for Learning from Heterogeneous Preferences

Parameter-Efficient Fine-Tuning of State Space Models

Parasite Networks: Transfer Learning in Resource-Constrained Domains

REACT: Residual-Adaptive Contextual Tuning for Fast Model Adaptation in Cybersecurity

RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates

Scalability of memorization-based machine unlearning

Self-Stitching: Widely Applicable and Efficient Transfer Learning Using Stitching Layer

Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition

Sharp Analysis for KL-Regularized Contextual Bandits and RLHF

Simultaneous Weight and Architecture Optimization for Neural Networks

Skip Transformers: Efficient Inference through Skip-Routing

SVFT: Parameter-Efficient Fine-Tuning with Singular Vectors

Teaching LLMs How To Learn with Contextual Fine-Tuning

Token Pruning using a Lightweight Background Aware Vision Transformer

TOU: Truncated-factorized reduction for an efficient-parameter model fine-tuning

Towards Long-Context Time Series Foundation Models With A Handful Of Additional Parameters

Towards Natural Machine Unlearning

TreeTop: Topology-Aware Fine-Tuning for LLM Conversation Tree Understanding