Jinhao Duan

Jinhao Duan (段金昊)

I am a postdoc researcher at UNC-Chapel Hill, working with Prof. Tianlong Chen. I obtained my Ph.D. degree at Drexel University (2025), advised by Prof. Kaidi Xu.

I am interested in Trustworthy Machine Learning, including Adversarial Robustness, Uncertainty Quantification, Security & Privacy of Large Foundation Models, with the potential applications in healthcare.

Email: jinhao@cs.unc.edu / Google Scholar / Github / Follow @Jinhao

Research Statement:

Responsible GenAI Decision-Making, including

1. Know When GenAI Decisions to be Correct.
a. LLM Uncertainty Quantification and Conformal Prediction: SAR [ACL’24], WSE [EAAI], ConU [EMNLP’24]
b. VLM Hallucination: TruthPrInt [arXiv'25]
2. Know When to Trust GenAI Decision-Making.
a. LLM Trustworthy Survey and Benchmark [HCC’24], Compressed LLM Trustworthy: CompDT [ICML’24]
b. Diffusion Model Privacy & Security: SecMI[ICML’23], PIA[ICLR’24]
c. Robustness: Typographic Deception [ECCV’24] Semantic, Copyright: SecDiD [ICMLW’23], GrIDPure [CVPR’24]
3. Know How to Correct GenAI Decisions.
a. Multi-Agent Game-Theoretical Evaluation: GTBench [NeurIPS’24]
b. Strategic Reasoning: ReTA [NAACL’25]
4. GenAI Applications: AI4Health, AI4Medicine, ...
a. Reminiscence Therapy: GuideLLM [NAACL’25, NeurIPSW’24]
b. Missing MRI Imputation: ReMiND [Imaging Neuroscience]

Selected Publications

(* indicates equal contribution)

UProp: Investigating the Uncertainty Propagation of LLMs in Multi-Step Agentic Decision-Making
Jinhao Duan, James Diffenderfer, Sandeep Madireddy, Tianlong Chen, Bhavya Kailkhura, Kaidi Xu
Paper / Github
arXiv, 2025

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention
Jinhao Duan*, Fei Kong*, Hao Cheng, James Diffenderfer, Bhavya Kailkhura, Lichao Sun, Xiaofeng Zhu, Xiaoshuang Shi, Kaidi Xu
Paper / Github
ICCV, 2025

GuideLLM: Exploring LLM-Guided Conversation with Applications in Autobiography Interviewing
Jinhao Duan*, Xinyu Zhao*, Zhuoxuan Zhang*, Eunhye Grace Ko, Lily Boddy, Chenan Wang, Tianhao Li, Alexander Rasgon, Junyuan Hong, Min Kyung Lee, Chenxi Yuan, Qi Long, Ying Ding, Tianlong Chen, Kaidi Xu
Paper / Short (Workshop)
GenAI4Health@NeurIPS, 2024 (Best Demo Paper Award🏆)
NAACL, 2025

GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations
Jinhao Duan*, Renming Zhang*, James Diffenderfer, Bhavya Kailkhura, Lichao Sun, Elias Stengel-Eskin, Mohit Bansal, Tianlong Chen, Kaidi Xu
Paper / Github / GTBench HF Leaderboard
NeurIPS, 2024

ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage Guarantees
Zhiyuan Wang, Jinhao Duan, Lu Cheng, Yue Zhang, Qingni Wang, Hengtao Shen, Xiaofeng Zhu, Xiaoshuang Shi, Kaidi Xu
Findings of EMNLP, 2024

Unveiling Typographic Deceptions: Insights of the Typographic Vulnerability in Large Vision-Language Model
Hao Cheng, Erjia Xiao, Jindong Gu, Le Yang, Jinhao Duan, Jize Zhang, Jiahang Cao, Kaidi Xu, Renjing Xu
ECCV, 2024

Shifting Attention to Relevance: Towards the Predictive Uncertainty Quantification of Free-Form Large Language Models
Jinhao Duan, Hao Cheng, Shiqi Wang, Alex Zavalny, Chenan Wang, Renjing Xu, Bhavya Kailkhura, Kaidi Xu
Github
ACL, 2024

Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression
Junyuan Hong*, Jinhao Duan*, Chenhui Zhang*, Zhangheng Li*, Chulin Xie, Kelsey Lieberman, James Diffenderfer,
Brian Bartoldson, Ajay Jaiswal, Kaidi Xu, Bhavya Kailkhura, Dan Hendrycks, Dawn Song, Zhangyang Wang, Bo Li
Paper / Project / Github / Leaderboard / Models
SeT@ICLR, 2024
ICML, 2024

ACT-Diffusion: Efficient Adversarial Consistency Training for One-step Diffusion Models
Fei Kong, Jinhao Duan, Lichao Sun, Hao Cheng, Renjing Xu, Hengtao Shen, Xiaofeng Zhu, Xiaoshuang Shi, Kaidi Xu
CVPR, 2024

Can Protective Perturbation Safeguard Personal Data from Being Exploited by Stable Diffusion?
Zhengyue Zhao, Jinhao Duan, Kaidi Xu, Chenan Wang, Rui Zhang, Zidong Du, Qi Guo, Xing Hu
CVPR, 2024

ReTA: Recursively Thinking Ahead to Improve the Strategic Reasoning of Large Language Models
Jinhao Duan, Shiqi Wang, James Diffenderfer, Lichao Sun, Tianlong Chen, Bhavya Kailkhura, Kaidi Xu
Paper
NAACL, 2024

An efficient membership inference attack for the diffusion model by proximal initialization
Fei Kong, Jinhao Duan, RuiPeng Ma, Hengtao Shen, Xiaofeng Zhu, Xiaoshuang Shi, Kaidi Xu
ICLR, 2024

ReMiND: Recovery of Missing Neuroimaging using Diffusion Models with Application to Alzheimer's Disease
Chenxi Yuan*, Jinhao Duan*, Nicholas J Tustison, Kaidi Xu, Rebecca A Hubbard, Kristin A Linn
Github
Imaging Neuroscience, 2024

RBFormer: Improve Adversarial Robustness of Transformer by Robust Bias
Hao Cheng, Jinhao Duan, Hui Li, Lyutianyang Zhang, Jiahang Cao, Ping Wang, Jize Zhang, Kaidi Xu, Renjing Xu
BMVC, 2023

Semantic adversarial attacks via diffusion models
Chenan Wang, Jinhao Duan, Chaowei Xiao, Edward Kim, Matthew Stamm, Kaidi Xu
BMVC, 2023

Are Diffusion Models Vulnerable to Membership Inference Attacks?
Jinhao Duan, Fei Kong, Shiqi Wang, Xiaoshuang Shi, Kaidi Xu
Paper / Github (SecMI) / Github (SecMI-LDM)
ICML, 2023

Improve Video Representation with Temporal Adversarial Augmentation
Jinhao Duan, Quanfu Fan, Hao Cheng, Xiaoshuang Shi, Kaidi Xu
IJCAI, 2023

Adademic Services

Program Committee (PC) member:
EMNLP (2023)
AAAI (2024)
CVPR (2024, 2025)
NeurIPS (2024, 2025)
ICLR (2025)
AISTATS (2025)
ICML (2025)
ICCV (2025)
Journal Reviewer:
ACM Computing Surveys
IEEE Transactions on Information Forensics & Security (T-IFS)
IEEE Security & Privacy
Machine Learning

Teaching

CS 590: Privacy, College of Computing and Informatics, Drexel University, Spring 2023
CS 486: Robust Machine Learning, College of Computing and Informatics, Drexel University, Spring 2023
CI 101: Computing and Informatics Design I, College of Computing and Informatics, Fall 2022

This website template is borrowed from Jon Barron.