Jiashuo Yu

引用次数

	总计	2019 年至今
引用	470	470
h 指数	10	10
i10 指数	10	10

260

130

195

20212022202320242 16 256 194

开放获取的出版物数量

查看全部

3 篇文章

1 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Yinan HeShanghai Al Laboratory在 pjlab.org.cn 的电子邮件经过验证
Yi WangShanghai AI Laboratory在 cse.cuhk.edu.hk 的电子邮件经过验证
Limin WangNanjing University在 nju.edu.cn 的电子邮件经过验证
Kunchang LiShenzhen Institutes of Advanced Technology, Chinese Academy of Sciences在 siat.ac.cn 的电子邮件经过验证
Ying ChengFudan University在 fudan.edu.cn 的电子邮件经过验证
Yaohui WangResearch Scientist, Shanghai AI Laboratory; Prev. PhD from Inria在 inria.fr 的电子邮件经过验证
Xinyuan ChenShanghai AI Laboratory在 sjtu.edu.cn 的电子邮件经过验证
Junfu PuTencent ARC Lab; University of Science and Technology of China在 mail.ustc.edu.cn 的电子邮件经过验证
Xiao SunScientist, Shanghai AI Laboratory在 pjlab.org.cn 的电子邮件经过验证

关注

Jiashuo Yu

Shanghai AI Laboratory

在 fudan.edu.cn 的电子邮件经过验证

Computer Vision Multimodal Learning


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Internvideo: General video foundation models via generative and discriminative learning Y Wang, K Li, Y Li, Y He, B Huang, Z Zhao, H Zhang, J Xu, Y Liu, Z Wang, ... arXiv preprint arXiv:2212.03191, 2022	162	2022
Internchat: Solving vision-centric tasks by interacting with chatbots beyond language Z Liu, Y He, W Wang, W Wang, Y Wang, S Chen, Q Zhang, Y Yang, Q Li, ... arXiv preprint arXiv:2305.05662, 2023	53	2023
Lavie: High-quality video generation with cascaded latent diffusion models Y Wang, X Chen, X Ma, S Zhou, Z Huang, Y Wang, C Yang, Y He, J Yu, ... arXiv preprint arXiv:2309.15103, 2023	50	2023
Internvid: A large-scale video-text dataset for multimodal understanding and generation Y Wang, Y He, Y Li, K Li, J Yu, X Ma, X Li, G Chen, X Chen, Y Wang, C He, ... ICLR2024, 2023	49	2023
MM-Pyramid: Multimodal Pyramid Attentional Network for Audio-Visual Event Localization and Video Parsing J Yu, Y Cheng, RW Zhao, R Feng, Y Zhang ACM MM2022, 2021	34	2021
Internvideo-ego4d: A pack of champion solutions to ego4d challenges G Chen, S Xing, Z Chen, Y Wang, K Li, Y Li, Y Liu, J Wang, YD Zheng, ... ECCV2022 Ego4D Workshop, 2022	29	2022
Seine: Short-to-long video diffusion model for generative transition and prediction X Chen, Y Wang, L Zhang, S Zhuang, X Ma, J Yu, Y Wang, D Lin, Y Qiao, ... ICLR2024, 2023	19	2023
Modality-Aware Contrastive Instance Learning with Self-Distillation for Weakly-Supervised Audio-Visual Violence Detection J Yu, J Liu, Y Cheng, R Feng, Y Zhang ACM MM2022, 2022	19	2022
Mpn: Multimodal parallel network for audio-visual event localization J Yu, Y Cheng, R Feng ICME2021, 2021	17	2021
Vbench: Comprehensive benchmark suite for video generative models Z Huang, Y He, J Yu, F Zhang, C Si, Y Jiang, Y Zhang, T Wu, Q Jin, ... CVPR2024, 2023	11	2023
Exploring Logical Reasoning for Referring Expression Comprehension Y Cheng, R Wang, J Yu, RW Zhao, Y Zhang, R Feng ACM MM2021, 2021	8	2021
Long-Term Rhythmic Video Soundtracker J Yu, Y Wang, X Chen, X Sun, Y Qiao ICML2023, 2023	6	2023
Improving multimodal speech enhancement by incorporating self-supervised and curriculum learning Y Cheng, M He, J Yu, R Feng ICASSP2021, 2021	5	2021
Internvideo2: Scaling video foundation models for multimodal video understanding Y Wang, K Li, X Li, J Yu, Y He, G Chen, B Pei, R Zheng, J Xu, Z Wang, ... arXiv preprint arXiv:2403.15377, 2024	4	2024
Learning Music-Dance Representations through Explicit-Implicit Rhythm Synchronization J Yu, J Pu, Y Cheng, R Feng, Y Shan IEEE Transactions on Multimedia, 2023	4*	2023

系统目前无法执行此操作，请稍后再试。

文章 1–15

每年引用数

重复的引用

合并的引用

添加合著者合著作者

关注

引用次数

合著作者