Zeming Wei

引用次数

	总计	2019 年至今
引用	114	114
h 指数	6	6
i10 指数	3	3

2023202439 75

开放获取的出版物数量

查看全部

3 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Yifei WangPostdoc, MIT在 mit.edu 的电子邮件经过验证
Yihao ZhangPeking University在 stu.pku.edu.cn 的电子邮件经过验证
Meng SunProfessor, School of Mathematical Science, Peking University在 math.pku.edu.cn 的电子邮件经过验证
Xiyue ZhangUniversity of Oxford在 cs.ox.ac.uk 的电子邮件经过验证
Jingyu Zhu在 stu.pku.edu.cn 的电子邮件经过验证
Chawin SitawarinPostdoctoral Researcher @ Meta在 meta.com 的电子邮件经过验证
David WagnerProfessor of Computer Science, UC Berkeley在 cs.berkeley.edu 的电子邮件经过验证
Julien PietUC Berkeley在 berkeley.edu 的电子邮件经过验证
Yichuan MoPh.D. Student, Peking University在 stu.pku.edu.cn 的电子邮件经过验证
Huanran ChenUndergraduate, Beijing Institute of Technology在 bit.edu.cn 的电子邮件经过验证
Hangzhou HePeking University在 stu.pku.edu.cn 的电子邮件经过验证
Sun JunProfessor of SCIS, SMU在 smu.edu.sg 的电子邮件经过验证
Stefanie JegelkaTUM and MIT在 mit.edu 的电子邮件经过验证

关注

Zeming Wei

Undergraduate, Peking University

在 stu.pku.edu.cn 的电子邮件经过验证 - 首页

Trustworthy AI Adversarial Robustness Explainability


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Jailbreak and Guard Aligned Language Models with Only Few In-Context Demonstrations Z Wei, Y Wang, Y Wang arXiv preprint arXiv:2310.06387, 2023	44	2023
CFA: Class-wise Calibrated Fair Adversarial Training Z Wei, Y Wang, Y Guo, Y Wang CVPR 2023, 2023	26	2023
Jatmo: Prompt injection defense by task-specific finetuning J Piet, M Alrashed, C Sitawarin, S Chen, Z Wei, B Alomair, D Wagner ESORICS 2024, 2024	10	2024
Sharpness-Aware Minimization Alone can Improve Adversarial Robustness Z Wei✉, J Zhu, Y Zhang ICML 2023 Workshop on New Frontiers in Adversarial Machine Learning, 2023	9*	2023
Using Z3 for Formal Modeling and Verification of FNN Global Robustness Y Zhang, Z Wei, X Zhang, M Sun SEKE 2023, 2023	6	2023
Extracting Weighted Finite Automata from Recurrent Neural Networks for Natural Languages Z Wei, X Zhang, M Sun ICFEM 2022, 2022	6	2022
On the Duality Between Sharpness-Aware Minimization and Adversarial Training Y Zhang, H He, J Zhu, H Chen, Y Wang, Z Wei✉ ICML 2024, 2024	3	2024
Fight back against jailbreaking via prompt adversarial tuning Y Mo, Y Wang, Z Wei, Y Wang ICLR 2024 Workshop on Secure and Trustworthy Large Language Models, 2024	3*	2024
Architecture Matters: Uncovering Implicit Mechanisms in Graph Contrastive Learning X Guo, Y Wang, Z Wei, Y Wang NeurIPS 2023, 2023	3	2023
Weighted Automata Extraction and Explanation of Recurrent Neural Networks for Natural Language Tasks Z Wei, X Zhang, Y Zhang, M Sun Journal of Logical and Algebraic Methods in Programming 136, 100907, 2023	3	2023
Characterizing Robust Overfitting in Adversarial Training via Cross-Class Features Z Wei, Y Guo, Y Wang OpenReview preprint, 2023	1	2023
Exploring the Robustness of In-Context Learning with Noisy Labels C Cheng, X Yu, H Wen, J Sun, G Yue, Y Zhang, Z Wei✉ ICLR 2024 Workshop on Reliable and Responsible Foundation Models, 2024		2024
Towards General Conceptual Model Editing via Adversarial Representation Engineering Y Zhang, Z Wei, J Sun, M Sun arXiv preprint arXiv:2404.13752, 2024		2024

系统目前无法执行此操作，请稍后再试。

文章 1–13

每年引用数

重复的引用

合并的引用

添加合著者合著作者

关注

引用次数

合著作者