我校颜成钢教授团队论文被计算机视觉顶级会议CVPR2024录用
来源:杭州电子科技大学 时间:2024-12-27 22:04:11
近日,我校颜成钢教授团队以杭州电子科技大学为第一单位发表的论文《Rethinking Boundary Discontinuity Problem for Oriented Object Detection》被计算机视觉顶会、CCF A类会议2024 IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR 2024) 录用。
该项研究由杭州电子科技大学、中国科学院计算技术研究所和杭州电子科技大学丽水研究院合作完成。该论文的第一作者为我校2020级博士研究生徐杭,指导老师为中国科学院计算所代锋副研究员和我校颜成钢教授,合作者还有杭电丽水研究院常务副院长朱尊杰老师。
有向目标检测在过去几年中得到了迅速的发展,其中检测模型的旋转等变性对于其高精度的定位极为关键。理想情况下,当目标旋转时,模型的预测框也能够保持相应的旋转。但通过经研究发现,有时目标位置在角度边界处时(0度或180度),检测器对于角度的预测将会产生严重的偏差,这就是旋转目标检测中经常被提及的边界不连续问题。长期以来,普遍认为这个问题是由于角度边界处的损失急剧增加所导致的。因此,一般使用平滑损失来解决该问题,其中最经典的是联合优化损失IoU-like方法,如KFIoU、GWD和KLD等。然而,本文通过实验发现,即使是最先进的IoU-like方法实际上也未能解决该问题。进一步分析发现,解决该问题的关键在于平滑函数的编码模式,而不是在损失优化上。在现有的IoU-like方法中,模型仍然试图拟合框和目标之间的角度关系。由于这种关系在角度边界处包含一个断点,检测器的预测在这一点附近变得高度不稳定,这才导致了边界不连续问题。为了解决该问题,本文提出了一个针对角度的双重优化范式,即将可逆性和联合优化从单一平滑函数中分离出来,形成两个不同的实体,从而实现了纠正角度边界和将角度与其他参数融合的目标。最后,在多个数据集上的广泛实验表明,通过使用本文提出的方法边界不连续问题得到了很好的解决。
杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师40余名,含5位国家级人才及多位省级人才,包括“海外引才计划”特聘教授、“海外引才计划”青年学者、浙江省“钱江学者”特聘教授、浙江省杰出青年基金获得者、浙江省“151人才工程”第一层次、浙江省高校中青年学科带头人重点资助等多名国家及省部级人才。现有硕博生100余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于通信、自动化、计算机、电子等学院。