负责人:刘红敏
成 员:樊彬,王粉花,张利欣,徐婧林,胡雨凡,刘子熠
研究方向:
计算机视觉、多模态协同感知、穿透感知
主要研究内容:
(1)多模态协同感知:针对复杂真实场景的智能探测与感知需求,研究可见光图像、红外图像、激光距离选通成像、激光雷达等多模态、多视角信息的融合、协同与优化方法,实现鲁棒高精的目标识别、跟踪、语义分割等,可广泛应用于极端天气、低光照、对抗环境等挑战环境下的无人系统智能感知任务,并为群体智能无人系统技术发展提供核心支撑。
(2)视觉三维信息感知:研究计算机视觉三维重建与定位方法、鲁棒特征提取与匹配方法、三维点云特征学习方法,实现机器对三维世界的理解。可广泛应用于三维数字孪生、增强现实、智能无人驾驶等应用系统。
(3)穿透成像与感知:依托团队搭建的激光距离选通成像系统,穿透烟、雾等不利成像条件,获取距离选通序列数据,实现对感兴趣目标的穿透成像;针对上述序列数据开展数据增强、目标检测等任务研究,推动激光距离选通技术在计算机视觉领域的发展,可应用于以消防、恶劣天候等场景为代表的透烟透雾等穿透感知任务。
主要教学、科研成果:
(一)团队成员整体介绍
机器视觉与智能感知团队包含教师7人,其中国家级青年科技人才2人,中国科协青年人才托举计划2人,北京市青年托举计划1人。团队现有博士研究生16人、在读硕士研究生45人。团队主持国家自然科学基金联合基金重点项目2项、国家重点研发计划课题2项,JKW主题项目2项,其他国家级项目10余项,以及横向项目10余项。团队在领域权威期刊/会议发表学术论文100余篇,授权国家发明专利20余项,团队教师担任IEEE T-Cyber、IEEE T-FS、IEEE T-CSVT、IEEE T-BD、IEEE RAL、CVPR、NeurIPS等多个权威国际期刊的编委和顶级国际会议的领域主席。
(二)团队教学及科研成果
教学方面,团队负责人刘红敏教授获河南省高等教育教学成果奖一等奖2项(第2、3)、北京科技大学第十届“研师亦友——我最喜爱的导师”、北京科技大学第四届本科生“十佳导师”;团队主导并参与中国机器人及人工智能大赛等多个科技竞赛,多位教师作为指导教师获第十九届“挑战杯”揭榜挂帅专项赛一等奖、2023年度中国机器人大赛暨ROBOCUP机器人世界杯中国赛决赛一等奖(冠军)、中国机器人及人工智能大赛全国总决赛一等奖、全国大学生信息安全与对抗技术竞赛一等奖等。团队多名研究生获国家奖学金、泰山钢铁奖学金等。
科研方面,团队负责人刘红敏教授获霍英东青年科学奖一等奖,团队多位教师获中国自动化学会自然科学奖一等奖、中国自动化学会科技进步一等奖、中国电子学会自然科学一等奖、河南省自然科学奖二等奖、中国图象图形学会自然科学奖一等奖、中国图象图形学会自然科学奖二等奖等多项奖励。团队科研成果受到国内外著名专家学者的大量引用和正面评价,在国际上产生了重要的学术影响,相关成果获得ECCV2016特征匹配竞赛冠军、CVPR2019视觉定位竞赛冠军、CVPR 2021 三维建模竞赛冠军、CVPR2019最佳论文奖提名等荣誉。
(三)代表性项目
(1)国家自然科学基金联合基金重点项目,面向多模复合探测的多源异构图像融合识别方法研究,2025.01-2028.12,主持.
(2)国家自然科学基金联合基金重点项目,面向海洋沿岸生物多样性智能监测的模式识别关键技术研究,2025.01-2028.12,主持.
(3)国家自然科学基金优秀青年科学基金项目,视觉三维信息感知,2023.01-2025.12,主持.
(4)国家重点研发计划“智能机器人”专项课题,水下多传感融合的操作/感知一体化仿生设计,2020.12-2023.11,主持.
(5)国家重点研发计划项目(政府间国际科技创新合作)课题,工业过程在线感知与操作模式智能优化,2023.01-2025.12,主持.
(6)国家自然科学基金面上项目,解耦迁移机制下水下图像清晰化研究,2023.01-2026.12,主持.
(7)国家自然科学基金面上项目,面向细粒度行为理解的多模态协同感知与分析方法,2024.01-2027.12,主持.
(8)国家自然科学基金面上项目,基于内蕴关系和注意力学习的点云深度学习方法研究,2021.01-2024.12,主持.
(9)北京市自然科学基金联合基金重点研究专题,面向多模态大模型端侧性能提升的知识蒸馏与量化压缩技术研究,2024.10-2027.09,合作单位主持
(10)华为公司委托项目,新型long-term特征提取与匹配技术,2020.05-2021.10,主持.
(四)代表性论文
(1)Chenghao Zhang, Gaofeng Meng*, Bin Fan*, Kun Tian, Zhaoxiang Zhang, Shiming Xiang, and Chunhong Pan. Reusable Architecture Growth for Continual Stereo Matching [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, DOI:10.1109/TPAMI.2024.3378884.
(2)Xiang Gao, Lingjie Zhu, Zexiao Xie, Hongmin Liu*, Shuhan Shen*. Incremental Rotation Averaging [J]. International Journal of Computer Vision (IJCV), 2021, 129: 1202-1216.
(3)Hongmin Liu, Canbin Zhang, Bin Fan, Jinglin Xu*. Pro2Diff: Proposal Propagation for Multi-Object Tracking via the Diffusion Model [J]. IEEE Trans. on Image Processing, 2024, 33:6508-6520.
(4)Hongmin Liu, Fan Jin, Hui Zeng, Huayan Pu, Bin Fan*. Image Enhancement Guided Object Detection in Visually Degraded Scenes [J], IEEE Trans. on Neural Networks and Learning Systems, 2024, 35(10): 14164-14177.
(5)Bin Fan, Junjie Zhou, Wensen Feng, Huayan Pu, Yuzhu Yang, Qingqun Kong, Fuchao Wu, Hongmin Liu*. Learning Semantic-Aware Local Features for Long Term Visual Localization [J]. IEEE Trans. on Image Processing (TIP), 2022, 31: 4842-4855.
(6)Yongjie Chen, Hongmin Liu*, Haoran Yin, Bin Fan. Building Vision Transformers with Hierarchy Aware Feature Aggregation [C]. International Conference on Computer Vision (ICCV), 2023: 5908-5918.
(7)Yingxu Qiao, Jiabao Cui, Fuxian Huang, Hongmin Liu*, Xi Li. Efficient Style-Corpus Constrained Learning for Photorealistic Style Transfer [J]. IEEE Trans. on Image Processing, 2021, 30: 3154-3166.
(8)Hongmin Liu, Yan Ding, Hui Zeng, Huayan Pu, Jun Luo, Bin Fan*. A Cascaded Multimodule Image Enhancement Framework for Underwater Visual Perception [J], IEEE Trans. on Neural Networks and Learning Systems, 2024, doi:10.1109/TNNLS.2024.3397886.
(9)Hongmin Liu, Yuefeng Cai, Bin Fan, Jinglin Xu*. ScalableTrack: Scalable One-Stream Tracking via Alternating Learning [J], IEEE Trans. on Neural Networks and Learning Systems, 2024, doi: 10.1109/TNNLS.2024.3402994.
(10)Hongmin Liu, Qi Zhang, Yufan Hu, Hui Zeng, Bin Fan*. Unsupervised Multi-expert Learning Model for Underwater Image Enhancement. IEEE/CAA Journal of Automatica Sinica, 2024, 11(3):708-722.