正在加载...
系统目前无法执行此操作,请稍后再试。
每年引用数
重复的引用
下面的文章将在学术搜索中合并。它们的
合并引用
次数只会计入第一篇文章。
合并的引用
此“引用引文的出版物数量”计数包含了对学术搜索中以下文章的引用次数。带有
*
标记的引文可能与个人学术档案中的文章有所区别。
添加合著者
合著作者
关注
此作者发表了新文章
有对此作者文章的新引用
有与此作者的研究工作相关的新文章
用于接收动态的电子邮件地址
完成
我的个人学术档案
我的图书馆
统计指标
快讯
设置
登录
登录
创建我的个人资料
引用次数
总计
2019 年至今
引用
27
27
h 指数
1
1
i10 指数
1
1
0
26
13
2023
2024
2
25
合著作者
Stephen Casper
PhD student, MIT
在 mit.edu 的电子邮件经过验证
Javier Rando
ETH Zurich
在 ai.ethz.ch 的电子邮件经过验证
Soroush Pour
Harmony Intelligence
在 soroushjp.com 的电子邮件经过验证
Rusheb Shah
Apollo Research
在 apolloresearch.ai 的电子邮件经过验证
Jessica Rumbelow
Leap Laboratories
在 leap-labs.com 的电子邮件经过验证
Vinoth Nandakumar
University of Sydney
在 sydney.edu.au 的电子邮件经过验证
Tongliang Liu
Director, Sydney AI Centre, University of Sydney & Mohamed bin Zayed University of AI
在 sydney.edu.au 的电子邮件经过验证
关注
Arush Tagade
ML Researcher, Leap Laboratories
在 leap-labs.com 的电子邮件经过验证
AI Safety
Interpretability
Model Evaluations
文章
引用次数
合著作者
标题
排序
按引用次数排序
按年份排序
按标题排序
引用次数
引用次数
年份
Scalable and transferable black-box jailbreaks for language models via persona modulation
R Shah, FM Quentin, S Pour, A Tagade, S Casper, J Rando
arXiv preprint arXiv:2311.03348
, 2023
27
2023
The SaTML'24 CNN Interpretability Competition: New Innovations for Concept-Level Interpretability
S Casper, J Yun, J Baek, Y Jung, M Kim, K Kwon, S Park, H Moore, ...
arXiv preprint arXiv:2404.02949
, 2024
2024
Prototype Generation: Robust Feature Visualisation for Data Independent Interpretability
A Tagade, J Rumbelow
arXiv preprint arXiv:2309.17144
, 2023
2023
Why do CNNs excel at feature extraction? A mathematical explanation
V Nandakumar, A Tagade, T Liu
arXiv preprint arXiv:2307.00919
, 2023
2023
系统目前无法执行此操作,请稍后再试。
文章 1–4
展开
隐私权
条款
帮助
关于学术搜索
Google 搜索帮助