报告题目:视觉多模态融合与感知
报告人:徐天阳 江南大学副教授
报告时间:2025年5月1日16:10-17:10
报告地点:秀山校区艺设楼214会议室
报告对象:999策略手机论坛版及相关学院师生
主办单位:999策略手机论坛版
报告内容:多模态视觉感知是实现视觉智能的重要研究内容,其面临着数据冗余性强、场景多样性高、模态差异性大等显著特点,为了应对上述挑战,有效融合多模态视觉信息尤为重要。本报告将以高效图像融合和精准目标跟踪为落脚点,介绍超轻量级多模态图像融合设计、特征级扩散融合跟踪模型、以及视觉多模态数据集构建三个方面内容,并分析上述方法对视觉多模态融合与感知的增益作用。
报告人简介:徐天阳,江南大学人工智能与计算机学院副教授。研究方向为视频理解,发表期刊与会议论文80余篇,包括CCF-A/IEEE汇刊50余篇,其中IEEE TPAMI/IJCV 8篇,谷歌学术引用5000余次,H-index为30,获中国图象图形学学会优秀博士学位论文奖,获PRCV2022最佳学生论文奖,获CVPR/ ICCV/ ECCV等模式识别和计算机视觉国际学术会议举办相关学术竞赛(VOT、MMVRAC、Anti-UAV、AI City Challenge、Perception Test Challenge)冠亚军10余项,入选斯坦福大学全球前2%顶尖科学家年度榜单。任中国人工智能学会模式识别专委会副秘书长,江苏省人工智能学会模式识别专委会副主任。