视觉多模态融合与感知

报告题目：视觉多模态融合与感知

报告人：徐天阳江南大学副教授

报告时间：2025年5月1日16:10-17:10

报告地点：秀山校区艺设楼214会议室

报告对象：999策略手机论坛版及相关学院师生

主办单位：999策略手机论坛版

报告内容：多模态视觉感知是实现视觉智能的重要研究内容，其面临着数据冗余性强、场景多样性高、模态差异性大等显著特点，为了应对上述挑战，有效融合多模态视觉信息尤为重要。本报告将以高效图像融合和精准目标跟踪为落脚点，介绍超轻量级多模态图像融合设计、特征级扩散融合跟踪模型、以及视觉多模态数据集构建三个方面内容，并分析上述方法对视觉多模态融合与感知的增益作用。

报告人简介：徐天阳，江南大学人工智能与计算机学院副教授。研究方向为视频理解，发表期刊与会议论文80余篇，包括CCF-A/IEEE汇刊50余篇，其中IEEE TPAMI/IJCV 8篇，谷歌学术引用5000余次，H-index为30，获中国图象图形学学会优秀博士学位论文奖，获PRCV2022最佳学生论文奖，获CVPR/ ICCV/ ECCV等模式识别和计算机视觉国际学术会议举办相关学术竞赛（VOT、MMVRAC、Anti-UAV、AI City Challenge、Perception Test Challenge）冠亚军10余项，入选斯坦福大学全球前2%顶尖科学家年度榜单。任中国人工智能学会模式识别专委会副秘书长，江苏省人工智能学会模式识别专委会副主任。

网站首页

999策略概况

组织机构

本科生教育

研究生教育

师资队伍

学科与科研

党建园地

学生工作

校友之家

招贤纳士

ENGLISH

视觉多模态融合与感知