
主编:孙圣和
创刊:1980年
ISSN:1002-7300
CN:11-2175/TN
国内邮发代号:2-369
- 浏览排行
- 引用排行
- 下载排行
2026, 49(7):1-8.
摘要:随着半导体技术的发展,晶体管数量持续增长,电压降违例已经成为超大规模集成电路电子设计和测试中的关键挑战。动态电压降高度依赖于标准单元开关瞬间产生的电流,因此,高效准确地预测标准单元的动态电流具有重要意义。本文提出一种基于LightGBM的标准单元瞬态电流预测模型,通过SPICE获取训练数据,提取特征,使用交叉验证和网格搜索方法搜索模型最佳参数。该模型能够在不同输出信号转换、电源电压、输入转换时间和输出负载电容组合下,对标准单元的动态电流进行建模与预测。使用该方法建模时,无需标准单元内部结构信息,建模过程高效、通用性强。实验结果表明,在模型精度方面,该模型在各类标准单元上进行动态电流预测时的决定系数均不小于0.928,模型精度优于XGBoost和RFR方法;在泛化能力方面,其适应性优于ANN和LSTM模型;在运行时间方面,该模型的建模时间和预测时间均小于ANN、LSTM和RFR方法。该模型在模型精度和计算资源上取得良好的平衡,可用于标准单元开关行为引发的动态电流预测,为动态电压降分析和违例检测提供高效可靠的支持。
2026, 49(7):9-17.
摘要:本文针对Paillier同态加密算法在加密及同态运算中存在的计算效率低及灵活性不足的问题,设计并实现了一种Paillier同态加密算法加速方案。该方案通过软硬协同设计技术,高效处理算法预计算、数据交互以及算法操作解析要求,有效提升了方案灵活性并降低了资源占用量。并且,方案通过定制化设计并使用了双高基数蒙哥马利模乘核心,显著提升了方案计算吞吐量及实时性。测试结果表明:方案对算法关键计算步骤的加速效果显著。在1 024位计算宽度下,模乘与模幂的计算的平均时延约为0.523、667.42 μs。相较于Intel I9.13900HX处理器,其时延分别降低约68.74%与42.76%(对应加速3.20倍与1.75倍)。所提出的方案能够为安全多方计算、联邦学习提供高效隐私计算支持。
2026, 49(7):18-27.
摘要:工业产品中的缺陷样本获取困难,而且缺陷的表现形式多种多样,针对如何能更好的识别缺陷,提高检测精度,提出一种基于GANomaly改进的异常检测模型SPGAN。首先,设计SPAM双注意力模块,通过空间注意力与位置感知注意力的协同机制,实现缺陷局部纹理与全局空间关系的联合感知;其次,在编解码器间引入改进的Inception模块,利用多尺度卷积核增强微小缺陷特征重构能力;最后,构建基于ResNet18的深度判别器网络,通过残差连接强化异常特征判别性能。为了验证改进网络的有效性,利用自制的轮胎数据集进行了一系列的对比实验和消融实验。实验结果表明,改进网络在自制的轮胎缺陷图像检测数据集上的检测与分割效果有了很大提升,其中AUC值达到了0.948,AP值达到了0.885,相比于原模型AUC值提升了9%,AP值提升了8.9%,从实验结果可以看出,该方法在工业缺陷检测领域具有较好的应用潜力。
2026, 49(7):28-39.
摘要:近年来,调制识别作为无线通信信号处理中的关键技术,在复杂开放环境下面临开集识别能力不足以及深度学习模型对输入相关性利用有限等挑战。针对上述问题,本文提出了一种基于改进深度可分离复值网络的开集调制识别方法。具体而言,该方法在深度可分离复值网络结构中引入多维注意力机制,有效挖掘信号幅度与相位之间的关联特征,并通过解码器辅助特征提取,实现多损失融合优化,包括平滑标签交叉熵、动态中心约束及重构误差,提升特征分布区分性和模型泛化能力。在公共数据集RadioML2016.10a上的实验表明,该方法在闭集识别任务中对已知类别的分类准确率达到95%,在开集识别场景下,已知类别的识别准确率为93%,未知类别的检测率为86%,整体开集识别性能为89%。上述结果展现出优异的开放环境适应能力。
2026, 49(7):40-46.
摘要:随着高速数字电路、宽带通信的发展,对高速信号测试技术提出了更高要求。取样器作为取样示波器的核心部件,其性能直接决定系统带宽,而触发脉冲的脉宽是制约取样器带宽的关键因素。为此,本文设计了一种基于超窄脉冲触发的宽带微波取样器。通过三级放大电路与阶跃恢复二极管级联,实现脉冲波形放大与边沿压缩,生成幅值>7 V、下降沿<150 ps的触发脉冲;在取样门电路中采用短路线反射技术,进一步将脉宽压缩至皮秒级;针对取样输出的梳状谱信号,设计了一种高阻积分调理电路,实现信号的展宽与保持。实测表明,该窄脉冲可有效驱动取样器,在30 GHz带宽内实现等效采样,输出锯齿波包络与输入信号一致,验证了取样器在宽带微波等效采样中的可行性。
2026, 49(7):47-54.
摘要:随着多任务学习在非接触式WiFi感知中的广泛应用,如何同时提升联合活动识别与室内定位任务的准确率并保持任务间的平衡成为关键挑战。为此,本文提出了一种改进MMoE方法来实现联合活动识别与室内定位任务。该方法设计统一共享特征提取层用于提升输入特征的表达能力;通过融合XceptionTime与ResNet构建多样化专家,前者适应于提取高频动态特征以提升活动识别准确率,后者则适合建模低频静态特征以提升定位精度;并引入双门控机制与正则化约束,在提升整体性能的同时有效平衡了两个任务的差异性。实验结果表明,所提方法在活动识别与室内定位两项任务上均优于现有代表性模型,展现出更高的准确性与稳定性。
2026, 49(7):55-63.
摘要:随着聚乙烯(PE)燃气管道使用寿命的延长,对PE燃气管道的缺陷检测已成为确保安全的核心问题。为解决在识别PE燃气管道内部缺陷时出现的漏检、错检和准确性不足的问题,本文提出了一种改进YOLOv8的目标检测模型。设计一个全新的C2f-KS模块,该模型通过将KolmogorovArnold Networks引入C2f模块中融合瓶颈层结构进行优化。此外,在通道分割操作之后融入注意力机制EffectiveSE,区分复杂背景下的有效信息,增强对目标特征的提取能力;将YOLOv8的3个检测头修改为4个目标检测头,并且引入RefConv卷积降低模型复杂度和模型参数量以增强对小目标的敏感性,有效降低小目标异物的漏检率和错检率。最后为了优化边界框的精准定位,采用损失函数Inner-Shape IOU。实验结果表明,改进后的算法在管道缺陷数据集上的精确度为94.0%,召回率为90.7%,平均精度均值为94.2%,模型大小仅为4.9 MB,可充分满足PE燃气管道内表面缺陷实时检测的需求。
2026, 49(7):64-73.
摘要:针对小型无人船易受到水面复杂环境影响及自身低频振动干扰,导致位姿估计精度低,无法提供可靠有效信息等问题,提出一种基于平滑迭代误差卡尔曼滤波的无人船位姿估计算法。在低速工况下,利用加速度计对纵摇角与横摇角进行补偿修正;在微机电系统(MEMS)传感器数据融合环节采用改进固定区间平滑算法,使用下一时刻新息对误差状态变量进行反向平滑修正的同时,进行时间反向逆推修正,减少低频线振动对有效信号的干扰;采用平滑估计值对量测值进行预测修正,每一时刻新息可反复迭代修正估计值和量测值,以提高整体位姿估计精度。实验结果表明,相较于误差状态卡尔曼滤波,平滑迭代误差状态卡尔曼滤波算法,横摇角、纵摇角和艏摇角均方根误差分别减少0.762 1°、1.818 8°、0.340 5°;正常水面航行情况下,东向、北向、天向速度均方根误差分别减少0.402 3、0.239 4、0.116 5 m/s;东向、北向、天向位置均方根误差分别减少0.148 4、0.258 9、0.083 2 m,能够为无人船提供更为精准的位姿信息。
2026, 49(7):74-82.
摘要:为提高短期风电功率预测精度,提出了一种融合单头注意力机制(SA)的双向长短期记忆网络(BiLSTM)和改进的北方苍鹰算法(INGO)调参的风电功率预测模型(INGO_BiLSTM_SA)。首先对风电数据进行预处理,采用Pearson相关系数法计算各因素和风电功率的相关程度,保留相关程度较高的因素,以提高模型预测精度;其次引入单头注意力机制,用于捕捉时序中的长程依赖关系,增加模型的泛化能力;最后针对BiLSTM超参数选择困难的问题,采用融合折射反向学习初始化和正余弦策略的改进的北方苍鹰算法对模型中的隐藏单元数目、最大训练周期和初始学习率3个超参数进行寻优,得到最优参数后利用INGO_BiLSTM_SA模型进行预测。通过新疆某风电站的数据进行实验验证,得到所提模型较原始的BiLSTM网络的决定系数提高了2.08%,均方根误差和平均绝对误差分别降低了23.0%和24.8%。
2026, 49(7):83-91.
摘要:针对伺服电机控制系统需要精确的电机动力学参数以提高控制器精度的问题,对永磁同步电机(PMSM)传统速度环PI控制中难以实现在线机械参数辨识的问题进行了研究,提出了一种超螺旋算法(STA)在线参数辨识策略。首先,使用递推最小二乘法(RLS)辨识得到的Cm、Bm进行摩擦转矩前馈补偿,然后基于SOGI-QSG算法进行幅值提取,在递归最小二乘法拟合离线参数的基础上,提出的在线机械参数辨识策略通过分析系统速度环频率特征,在实现PMSM矢量控制系统速度环PI参数自整定的同时,实现PMSM矢量控制系统在线惯量辨识,并使用Matlab simulink进行仿真实验验证。研究结果表明:STA惯量辨识策略可以在调节PMSM速度环PI参数的同时实现转动惯量的在线辨识,实现相对误差0.352 9%,结果对比RLS和扩展卡尔曼滤波算法(EKF),精度分别提升4.33%和17.3%,证明本策略的有效性和实用性。
2026, 49(7):92-102.
摘要:风电功率具有强波动性与随机性,给电网调度与风电并网运行带来挑战。为提升风电功率预测的精度,本文提出一种基于通道独立指数滑动平均分解(CW-EMA)与组合神经网络的超短期风电功率预测模型(CESF-Net)。该模型首先通过噪声密度聚类算法(DBSCAN)识别并剔除风速-功率关系中的离群点,并采用线性插值进行缺失值填补;其次,利用CW-EMA实现多变量序列在通道维度上的趋势与季节分解;然后,利用时间序列分段机制提高模型对局部时间结构的捕捉能力,并构建快速傅里叶变换注意力与门控循环单元的双流网络,分别对季节性特征与趋势性特征进行处理;最后,将双流网络的输出进行拼接,形成CESF-Net模型。在风电场实测数据集上的实验表明,CESF-Net模型在15 min预测任务中,MAE、RMSE、R2较常用模型分别提升18.78%、11.11%、0.26%;在60 min预测任务中,尽管各模型的预测精度均有所下降,但CESF-Net的各项指标仍分别提升了2.98%、2.74%和0.61%。
2026, 49(7):103-110.
摘要:针对T型三电平逆变器在传统控制下中点电位波动大、电流纹波和共模电压较大的问题,提出了一种自适应模型预测控制策略,解决了使用模型预测控制中模型参数变化导致控制精确低的问题。通过系统辨识参数变化并进行实时更新,减小了系统扰动对模型预测的影响,提高了中点电位平衡能力,减小了电流纹波和共模电压。并通过MATLAB仿真对上述方法进行了验证,所提方法逆变器输出电流谐波含量为0.75%,最大中点电位波动为2.6 V,共模电压峰值为2 V,结果表明此方法相比与传统模型预测控制,可以显著提高T型三电平逆变器中点电位平衡、电流纹波和共模电压的控制精度。
2026, 49(7):111-122.
摘要:无人机巡检是输电线路检测的重要方式之一。针对现有的输电线路检测算法目标尺度变化大、小目标检测困难、复杂场景下难以有效捕捉缺陷细节等问题,提出一种YOLO11改进模型HCDNet-YOLO11。首先,设计HCDNet网络代替原始的特征金字塔网络,降低模型的参数量,增强模型对不同尺度特征的表达;其次,构建MulCAA注意力模块,通过平均池化和最大池化的双分支结构提取关键信息,减少信息损失,通过长距离像素间的依赖关系削弱复杂背景对检测目标的干扰;最后,引入重参数化卷积RepConv实现Rep_C3k2模块,增强模型的非线性特征建模能力,提升检测精度和推理速度。实验结果表明,HCDNet-YOLO11算法在输电线路自建数据集上准确率提升了1.9%,召回率提升了6.5%,mAP50提升了5.7%,参数量减少了24.42%,该算法在减少参数量的前提下取得了很好的性能。在公共数据集VisDrone2019上,HCDNet-YOLO11算法在val集和test集上mAP50分别提升6.5%和4.6%,验证了其对复杂空域场景的强泛化能力。
2026, 49(7):123-131.
摘要:以中间包钢水非等温流动为研究背景,面向在生产条件下监测中间包钢水多点温度的实际需求,针对连铸车间现有测温系统无法散布且精准地监测到多点温度的问题,研发了中间包内嵌分布式钢水连续测温系统。首先创新性地提出了采用穿壁式黑体空腔的测量方式,对光电池产生的微弱信号进行低功耗采集和抗高温漏电干扰处理,通过热传导分析计算定制设计隔热箱来抵御永久层的热冲击,最终对系统的连续测温性能进行了对比测试。结果表明,感温探头黑体空腔结构能够灵敏感知温度变化,测温节点能够精确采集pA级电流信号,测温节点的静态功耗在60 μA左右,隔热箱能够持续12 h保证内腔温度不高于50℃,通过与高温炉以及热偶测温系统数据对比分析可知,整体系统的连续测温性能是稳定准确的。综上所述,系统能够在生产条件下实现对中间包钢水多点温度的监测,为研究中间包钢水非等温流动提供了实际系统级支撑。
2026, 49(7):132-142.
摘要:针对运动想象脑电信号(MI-EEG)空间分辨率低及个体差异性大导致的模型解码性能受限问题,创新性地提出了一种基于注意力双分支卷积网络(ADBCN)和时序多尺度注意力机制(TMSA)的DBTNet模型。该模型通过双分支卷积网络多尺度提取时空特征,结合高效多尺度注意力机制(EMA)强化对EEG信号的空间特征提取能力。随后,采用时序多尺度注意力机制以不同感受野同时捕获局部特征与全局依赖关系,从而获得更丰富的特征信息。最终通过分类器进行特征融合,实现高效解码。在受试者依赖评估方法中,该模型在BCI竞赛IV-2a数据集上的4分类准确率为86.57%,Kappa系数为0.821 0;在BCI竞赛IV-2b数据集上的二分类准确率为88.95%,Kappa系数为0.779 0。实验结果表明,DBTNet模型具有优异的解码性能。
2026, 49(7):143-150.
摘要:针对动态时间规整及其传统加权变体在城市交通状态时序测量中存在的关键时段敏感度不足与权重分配机制不合理的问题,提出一种基于高斯函数加权的改进型动态时间规整方法,以提升轨迹相似性度量的判别精度。该方法通过构建时间依赖的多峰高斯权重函数,将城市交通流的拟高斯分布特性与高峰时段先验知识融入序列对齐过程,非线性地强化交通高峰时段在距离计算中的贡献度。实验以成都市出租车GPS轨迹数据为基础,构建以小时为时间粒度的空间网格出发点数量时间序列。结合K-Medoids聚类算法,引入轮廓系数和Calinski-Harabasz指数对GS-WDTW、DTW与WDTW的算法性能进行定量评估。结果表明,在最优聚类数K=4时,GS-WDTW的轮廓系数和Calinski-Harabasz指数分别相较于DTW提升了39.9%和13.1%,相较于WDTW提升了41.1%和13.0%,有效提升了出行模式时空特征的识别能力。空间分析验证了聚类结果与城市功能区分布的高度吻合性。GS-WDTW方法能够更精准地捕捉时序数据中的关键非线性特征,为智慧交通系统的状态感知、资源优化和功能区识别提供参考。
2026, 49(7):151-160.
摘要:针对下肢关节角度预测精度低、实时性差及模型泛化弱等问题,提出了一种基于VMDInformer和表面肌电信号(sEMG)的下肢关节角度预测方法。首先采集受试者在行走和上楼模式下的下肢sEMG及对应关节角度数据,为增强原始数据的稳定性,采用变分模态分解(VMD)算法对肌电信号进行分解,负梯度和自适应粒子群算法(NGSPSO)对VMD的两个关键参数进行了优化:本征模态函数(IMF)的成分数量与惩罚因子。其次,从各IMF中提取多域特征,采用主成分分析法(PCA)从特征序列中提取关键因素,从而降低模型的输入维度。最后,运用Informer模型对多变量特征序列进行动态时序建模。实验结果表明,所提VMD-Informer模型在平地行走场景中髋、膝关节RMSE分别为2.688 5°和3.351 6°,在上楼梯场景中RMSE分别为3.508 8°和3.856 2°,相比VMD-Transformer平均误差降低18%,明显提升了预测精度与系统实时性,为康复外骨骼的运动意图识别提供了技术支撑。
2026, 49(7):161-170.
摘要:岩心区域的准确提取在数字岩心构建与智能油气储层评价等任务中具有重要意义。然而,岩心图像常伴随复杂背景、边缘模糊及多尺度结构分布等问题,给自动化分割带来较大挑战。为此,提出了一种基于改进UNeXt架构的岩心目标提取算法,旨在提升模型对岩心区域的分割性能。该方法通过在网络不同层次引入CBAM或EMA模块,有效增强模型对边缘细节和全局上下文特征的表达;同时,在网络颈部设计并引入多尺度特征增强模块,以进一步提升模型对多尺度结构及复杂纹理的感知能力。此外,考虑到目前缺乏专门用于岩心区域提取的公开数据集,本文自主构建了相关的岩心图像数据集。实验结果显示,与原始UNeXt网络相比,所提算法在mIoU、F1-score和mPA 3项指标上分别提升1.49%、2.06%和0.75%,同时MSE下降78.63%,且通过统计检验证实上述提升均具有显著性。为验证模型的泛化性能,本文还在BRISC 2025和EBHI-Seg两个公开医学图像数据集上进行了对比实验,结果表明本文算法在自建数据集和公开数据集上均表现优异。
2026, 49(7):171-180.
摘要:单幅图像去雪是图像恢复领域的重要分支,其主要挑战在于雪粒遮挡和雪雾模糊会导致图像退化,从而影响下游视觉任务的效果。针对现有方法在特征建模单一与专家选择自适应性不足的问题,提出了一种基于互补混合专家与一致性偏置子网路由的单幅图像去雪模型SynergyRestorer。首先,提出了互补混合专家解码器,通过专精与协作专家实现了多维度特征间的互补,增强模型的建模能力。同时,设计了一致性偏置子网路由,通过融合多源特征并引入一致性信号,动态权衡不同特征之间的协调与冲突,增强专家选择的判别能力与自适应能力。实验结果表明,所提方法在CSD、Snow100K和SRRS 3个主流基准数据集上的平均PSNR和SSIM分别达到33.71 dB与0.950,验证了其在复杂雪景恢复任务中的有效性。
2026, 49(7):181-189.
摘要:针对无人机航拍图像中小目标占比较高,目标尺度差异大以及背景复杂等因素导致的目标检测精度不足等问题,并结合边缘设备算力与功耗受限的特点,在YOLOv8n的基础上提出了一种改进的目标检测算法——EGD-YOLO。首先,增加用于小目标检测的P2层并移除用于大目标检测的P5层,同时采用浅层通道扩展策略以增强小目标特征表达能力;其次,设计了多尺度特征融合与加权特征融合级联的自适应多层次全局特征融合架构,实现颈部网络跨尺度语义信息的高效传播与深度整合;最后,采用具有多重注意力机制的DyHead动态检测头,进一步优化模型的小目标检测性能。在VisDrone2019数据集的实验结果表明,所提EGD-YOLO相较于基准模型在mAP0.5和mAP0.5:0.95等指标上分别提升了12.0%和8.6%的同时保持了良好的计算优势;在DOTA数据集的实验结果进一步验证了该方法具有良好的泛化能力,为无人机航拍小目标检测提供了有效的解决方案。
2026, 49(7):190-202.
摘要:为提升钢轨表面缺陷检测的准确性与小目标识别能力,设计了一种基于YOLOv10n的轻量化目标检测模型。该模型在浅层骨干网络引入C2f_CGBlock,以增强局部上下文感知与特征表达能力;特征融合部分采用RepGFPN,并在部分回传路径中引入SimAM以突出关键信息。模型训练中使用InnerSIoU损失函数以优化定位精度。实验在钢轨表面缺陷数据集上进行验证,结果显示,改进模型在Precision、Recall、F1和mAP@0.5等指标上分别提升了3.38%、3.72%、3.55%和4.01%,相比基准模型在小尺寸缺陷和复杂背景下的检测效果有明显提升。该模型在兼顾检测精度与实时性的同时,显著提升了钢轨缺陷检测性能,具备良好的工程应用前景。
2026, 49(7):203-214.
摘要:胸部疾病在早期诊断中具有重要意义,现有X光图像分类方法因特征提取中信息交互不足以及微小病灶辨识困难等问题导致分类效果不佳。为此提出一种基于注意力机制与多尺度特征融合的胸部X光图像疾病分类网络FFA-Net。首先,该网络通过任务交叉注意模块在水平和垂直方向上有效捕获全局上下文信息,增强特征间的交互;其次,通过构建多分支提取模块,在不同尺度下融合特征信息,使其深层特征能够聚焦于浅层特征中识别出的细微病理区域;最后,设计了一个能够提取不同频率特征并抑制噪声干扰的多频率语义注意力模块。在ChestX-ray14数据集上对所提出的方法进行了综合实验,结果显示,平均AUC值为0.856 4,对疝气的AUC值达到0.973 4;并通过消融实验以及在CheXpert和COVID-19 Radiography Database两个数据集进行泛化实验,数据显示,在CheXpert数据集上的平均AUC值为0.811;在COVID-19 Radiography Database数据集上的平均Accuracy为0.956 0。相较于当前流行的分类网络,FFA-Net具备更好的特征提取能力和分类效果。
2026, 49(7):215-225.
摘要:针对煤矿井下背景复杂、矿工行为尺度差异大和频繁遮挡等因素导致的现有行为检测模型精度低、鲁棒性不足的问题,提出一种改进RT-DETR矿工不安全行为检测方法。该方法构建了具备多路径特征提取与双分支下采样结构的主干网络CANet,通过融合深浅层级特征并保留边缘细节,提升了模型在复杂背景下对行为细节的感知能力。同时,设计扩散感知特征金字塔网络DAFPN,通过结合维度感知选择性集成模块与跨层扩散策略,构建两阶段融合—扩散机制,以增强多尺度行为特征间的语义交互,显著提升了模型对姿态多变和大尺度差异场景的适应能力。此外,引入可变核卷积模块AKConv,通过动态调整采样位置,使网络在存在遮挡时仍能自适应聚焦于行为关键区域,增强矿工行为检测的鲁棒性。实验结果表明,改进后的RT-DETR模型在mAP@0.5和mAP@0.5:0.95上分别达到92.9%和66.1%,较原模型分别提升2.9%和1.9%,参数量减少18%,计算量降低13%。与 Faster R-CNN、SSD、YOLOv5m、YOLOv8m、YOLOv10m 等主流检测算法相比,整体性能更优,充分证明了该模型在复杂煤矿场景下不安全行为检测的有效性与工程应用价值。
2026, 49(7):226-235.
摘要:针对LSTR算法在复杂道路场景下存在的局部细节捕捉能力不足与计算复杂度高的问题,本研究提出动态多路径协方差Transformer检测模型DMCTR。首先,构建特征增强与抑制模块,通过增强与抑制特征操作,缓解传统卷积对弯曲车道及虚线段等弱特征的漏检问题;其次,构建动态增强双通道注意力模块,利用可变形卷积适应车道几何形变,并结合双注意力机制增强局部几何特征;最后在Transformer架构中引入交叉协方差注意力机制,进而替换Transformer编码器中的多头自注意力。实验结果表明,在TuSimple数据集上,DMCTR准确率达到96.74%,较基线LSTR模型提升0.56%;在CULane数据集复杂场景下,F1值提升4.48%,车道线模糊、夜晚强光等特殊场景检测精度提升显著,使得模型在保持实时性(353 fps)的同时,有效解决了传统方法在复杂场景下的特征建模瓶颈。
2026, 49(7):236-244.
摘要:针对工业机器人自动化应用场景下,现有目标检测算法存在处理尺度变化大的目标时检测准确度低、遮挡处理效果差及实时性不足等问题,以YOLOv11n为基准模型设计并提出YOLOv11n-RLW算法。具体改进包括:采用RepViT主干网络替代传统特征提取网络,增强特征提取能力;加入LA-CBAM注意力机制解决SE模块缺乏空间特征的问题,提升多尺度特征融合;用Wise-IoU损失函数替代CIoU,提高回归精度。在VisDrone2019和KITTI数据集上,该模型以260 fps速度实现38.4%的mAP50,参数量仅2.24 M。相比基准模型,实时性上提升6%,识别率上提升5%,参数量减少了13.6%。该算法有效解决了多尺度目标检测、遮挡处理及实时性不足的问题。满足工业场景对检测速度和检测精度的要求,适用于高精度工业机器人目标检测系统的工程化应用。

主编:孙圣和
创刊:1980年
ISSN:1002-7300
CN:11-2175/TN
国内邮发代号:2-369