北京信息科技大学学报(自然科学版)

2025, v.40;No.168(06) 59-68

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于小波变换的多模态航拍车辆目标检测网络
Multimodal aerial vehicle object detection network based on wavelet transform

李洪玉,韩晶,吕学强

摘要(Abstract):

可见光与红外模态间的差异导致弱光环境下的车辆检测任务面临空间和语义对齐问题;此外,红外模态图像分辨率不足也使得小目标车辆特征提取困难。为此,提出一种无人机视角下基于小波变换的多模态航拍车辆检测网络(wavelet transform-based multimodal aerial vehicle detection network, WAVDNet)。首先,设计基于小波变换的特征增强模块,利用高频信息强化特征提取能力,并据此筛选关键特征向量,以抑制模态间的冗余信息干扰。此外,设计了一种可变形注意力模块,利用高频信息进行采样点的自适应调节,解决模态间的空间和语义对齐问题,对可见光和红外模态的特征进行多语义层次的自适应融合。最后,在DroneVehicle和VEDAI两个基准数据集上进行的实验表明,所提算法的mAP@0.5指标分别达到了81.7%和90.7%,优于多种当前先进算法,高于次优算法1.4和3.5百分点,验证了所提算法的有效性。

关键词(KeyWords): 可见光-红外;多模态融合;小波变换;特征筛选;可变形注意力

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金项目(62171043);; 北京市自然科学基金项目(4254096);; 北京市教委科研计划科技一般项目(KM202311232003)

作者(Author): 李洪玉,韩晶,吕学强

DOI: 10.16508/j.cnki.11-5866/n.2025.06.007

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享