CVPR 2026PastAgentsSafety & alignmentComputer vision

The 6th Workshop of Adversarial Machine Learning on Computer Vision: Safety of Vision-Language Agents

6thAdvML

Website unknown — help us add it OpenReview venue ↗See all CVPR workshops →✎ Edit this entry

Submission deadline: Mar 8, 2026, 16:00 UTC
OpenReview-synced 2026-03-08 16:00 UTC (as of 2026-06-23) — extensions on OpenReview are applied automatically; verify on the website.
Submission portal: OpenReview
Notes: Topics were auto-suggested and may be imprecise — edits welcome.

Accepted papers (10)

Fetched from OpenReview (v2) on 2026-06-10.

ARMs: Adaptive Red-Teaming Agent against Multimodal Models with Plug-and-Play Attacks
Zhaorun Chen, Xun Liu, Mintong Kang, Jiawei Zhang, Minzhou Pan, Shuang Yang, Bo Li · PDF
ATAC: Augmentation-Based Test-Time Adversarial Correction for CLIP
Su Linxiang, András Balogh · PDF
Auditing Traffic-Sign Robustness via DDIM Inversion: Do Diffusion Latents Preserve Shadow Attacks?
Ashton B. McEntarffer, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé · PDF
Evaluating Vulnerabilities in Vision-Language Models: Impact of Behavior-Induced Interference
Yuwei Chen, Shiyong Chu · PDF
Interpretable Adversarial Prompt Tuning via Semantic Concepts
Pedram MohajerAnsari, Zongxi Liu, Yi Zhu, Amir Salarpour, Mert D. Pesé · PDF
MirrorCheck: Efficient Adversarial Defense for Vision-Language Models
Samar Fares, Toluwani Aremu, Klea Ziu, Nikita Durasov, Martin Takáč, Pascal Fua, Karthik Nandakumar, Ivan Laptev · PDF
Robustness of Vision Foundation Models to Common Perturbations
Hongbin Liu, Zhengyuan Jiang, Cheng Hong, Neil Zhenqiang Gong · PDF
SafeGRPO: Self-Rewarded Multimodal Safety Alignment via Rule-Governed Policy Optimization
Xuankun Rong, Wenke Huang, Tingfeng Wang, Daiguo Zhou, Bo Du, Mang Ye · PDF
SASA: Sequence-Aware Shadow Attacks via Attention Alignment for Traffic Sign Recognition
Amir Salarpour, Pedram MohajerAnsari, David Fernandez, Mert D. Pesé · PDF
SkillJect: Automating Stealthy Skill-Based Prompt Injection for Coding Agents with Trace-Driven Closed-Loop Refinement
Xiaojun Jia, Jie Liao, Simeng Qin, Jindong Gu, Wenqi Ren, Xiaochun Cao, Yang Liu, Philip Torr · PDF

Accepted papers (10)

☆ARMs: Adaptive Red-Teaming Agent against Multimodal Models with Plug-and-Play Attacks

☆ATAC: Augmentation-Based Test-Time Adversarial Correction for CLIP

☆Auditing Traffic-Sign Robustness via DDIM Inversion: Do Diffusion Latents Preserve Shadow Attacks?

☆Evaluating Vulnerabilities in Vision-Language Models: Impact of Behavior-Induced Interference

☆Interpretable Adversarial Prompt Tuning via Semantic Concepts

☆MirrorCheck: Efficient Adversarial Defense for Vision-Language Models

☆Robustness of Vision Foundation Models to Common Perturbations

☆SafeGRPO: Self-Rewarded Multimodal Safety Alignment via Rule-Governed Policy Optimization

☆SASA: Sequence-Aware Shadow Attacks via Attention Alignment for Traffic Sign Recognition

☆SkillJect: Automating Stealthy Skill-Based Prompt Injection for Coding Agents with Trace-Driven Closed-Loop Refinement

ARMs: Adaptive Red-Teaming Agent against Multimodal Models with Plug-and-Play Attacks

ATAC: Augmentation-Based Test-Time Adversarial Correction for CLIP

Auditing Traffic-Sign Robustness via DDIM Inversion: Do Diffusion Latents Preserve Shadow Attacks?

Evaluating Vulnerabilities in Vision-Language Models: Impact of Behavior-Induced Interference

Interpretable Adversarial Prompt Tuning via Semantic Concepts

MirrorCheck: Efficient Adversarial Defense for Vision-Language Models

Robustness of Vision Foundation Models to Common Perturbations

SafeGRPO: Self-Rewarded Multimodal Safety Alignment via Rule-Governed Policy Optimization

SASA: Sequence-Aware Shadow Attacks via Attention Alignment for Traffic Sign Recognition

SkillJect: Automating Stealthy Skill-Based Prompt Injection for Coding Agents with Trace-Driven Closed-Loop Refinement