
主编:孙圣和
创刊:1980年
ISSN:1002-7300
CN:11-2175/TN
国内邮发代号:2-369
- 浏览排行
- 引用排行
- 下载排行
2025, 48(15):1-10.
摘要:为减小动态物体对视觉SLAM的干扰,提出一种基于运动概率筛选和加权位姿估计的鲁棒动态RGB-D SLAM。首先,利用实例分割网络Yolact获取场景的语义信息,结合语义信息和深度信息对动态掩膜边界修复,根据先验运动概率的大小计算语义动态概率。然后,采用基于语义引导的方法,计算特征点的几何动态概率,将语义动态概率和几何动态概率及其置信度,通过加权融合的方式构造特征点的运动概率模型,并设计具有自适应概率阈值的特征点筛选策略。最后,在系统的位姿跟踪、局部地图优化、全局优化过程中,设计基于特征点运动概率的加权代价函数,以区分不同特征点对位姿优化的贡献。此外,在移除动态物体之后,对静态场景建立全局点云地图。公开数据集的实验结果表明,相较于ORBSLAM2,所提算法在TUM RGB-D和Bonn数据集上的绝对轨迹误差的均方根误差分别平均降低69.16%和91.94%;与其他先进的动态SLAM算法相比,所提算法的位姿估计精度和鲁棒性均有一定程度的提升。在真实场景实验中,相较于ORB-SLAM2、DynaSLAM,轨迹端点漂移误差分别平均降低52.20%、19.15%。
2025, 48(15):11-19.
摘要:针对在监测发动机轴承温度时,有天线安装、信号传输困难的问题,本文提出了基于声表面波温度传感器的极近场遥测天线的完整设计方案。首先通过理论分析得出极近场区的电磁场分布特性,并经过仿真优化设计出在2~3 GHz频段内具有宽频带特性的极近场天线,且带内反射系数小于-10 dB;其次提出天线保持架,合理设计装配架构;再次通过在极近场天线表面介质覆盖的方法,提升能量传递效率约14.80%,从而改善信号传输质量,减小能量传递过程中的变化速度约54.36%,由此提高后续整体遥测系统的稳定性;最后,将极近场天线安装传感器后连接到遥测系统对轴承运行时的温度进行实际测量,验证了极近场天线及其装配架构的实用性和介质覆盖方法的可行性。
2025, 48(15):20-26.
摘要:为满足医疗用非制冷热红外探测器悬浮结构的高效制备需求,本文提出一种基于<100>晶向硅片的正面开口快速湿法腐蚀工艺。设计了折线型、长条形以及复合型3种<100>晶向狭缝状开口结构,并结合SiO2/Si3N4应力补偿复合膜,在摩尔浓度为30%的KOH溶液中,80℃水浴温度下,采用各向异性腐蚀技术进行120 min的腐蚀后,实现了悬浮结构的高精度释放。实验结果表明,复合型开口通过在悬臂梁区域增设辅助开口,显著提高了腐蚀液的渗透效率。与背面牺牲层腐蚀方法相比,腐蚀时间缩短了60%。效果远优于正面牺牲层腐蚀,释放面积达到98%以上,成品率提升至95%。在此基础上,采用与CMOS工艺完全兼容的单面加工流程,成功制备出P/N多晶硅热电堆与非晶硅微测辐射热计单元。在耳温/额温检测中,实现了±0.1℃的测温精度以及小于500 ms的响应时间,满足了医疗级设备对高精度和快速响应的要求。本研究提出的“晶向设计-应力调控-腐蚀优化”一体化工艺流程,为高性能悬浮结构的批量制备提供了可靠方案,在可穿戴健康监测设备领域具有重要应用价值。
2025, 48(15):27-34.
摘要:当前基于深度学习的方法在可变形医学图像对齐任务中得到了广泛的应用,其中利用新颖的损失函数和有效的网络架构提高配准效果是常用的做法。本文设计了多尺度特征感知损失和注意力模块ECA-D,改进了只用均方误差或归一化互相关的设计思路。本文利用多站点医学图像数据训练获得一个分类神经网络,并构建多尺度特征的学习过程,提高了分类网络的准确性,进而设计多尺度的感知损失函数提高配准的准确性。为了提高对齐网络的学习能力,设计了一种新的注意力模块ECA-D,更有效地利用空间和通道信息。在LPBA40数据集上训练后,与最先进的方法相比,提出的模型在未经训练的Neurite OASIS上的Dice评分提高了3%。实验结果表明,本文的方法具有更高的配准精度和更好的鲁棒性。
2025, 48(15):35-41.
摘要:针对SMOTE算法在处理脉搏波数据不平衡问题中存在噪声干扰敏感及生成样本物理特性失真等问题。本文提出了一种基于CEEMDAN改进的CP-SMOTE算法,将预处理的脉搏波分解为主波层与次波层分别生成样本,可有效去除残余噪声。同时,在生成新样本时,本算法结合脉搏波信号特征,设计了自适应距离度量和约束监督机制,确保生成样本在保持数据物理特性的同时增强类间区分度。基于自建数据集和公开PPG-BP数据集,结合四种分类器对改进算法进行了全面实验。在自建数据集中,CP-SMOTE在AUC、G-mean、F1等关键指标上全面超越SMOTE系列算法,最低提升1.51%,最高提升18.25%。在公开数据集中对比其他改进算法准确率、G-mean和AUC分别提升2.24%、1.47%和1.43%以上。结果表明,该算法显著优于传统SMOTE及其他变种算法,研究结果验证了该算法生成的样本有效避免了物理特性失真问题与噪声干扰问题。
2025, 48(15):42-51.
摘要:针对光伏出力受天气条件随机性和波动性影响的特点,提出一种基于KNN-LASSO-PCC法的改进BitCN-LSTM神经网络短期光伏功率预测方法。首先,采用KNN对数据集进行清洗,再结合LASSO与PCC进行多层特征筛选;然后,在传统BitCN-LSTM方法基础上加入GRU与Elman神经网络,其中,GRU解决长时间依赖问题和参数优化问题,Elman网络增强局部时序建模和记忆能力;最后,在多层特征筛选下选取直角辐射、散角辐射、气温和湿度作为输入变量,选取光伏电站各时段发电功率的预测值作为最终输出,进行为期1~3天间隔15 min进行一次预测的仿真,所得的最优评估指标平均绝对误差、均方误差以及平均绝对百分比误差分别为9.976 3%、1.702 9%和10.626 7%,训练时间和最优测试时间分别为181.305 1 s和0.058 932 s,相较于其他常见的短期光伏预测模型精度更高,速度更快。
2025, 48(15):52-62.
摘要:针对光伏电池缺陷检测中,由于缺陷形态不规则、尺寸多变及缺陷种类繁多等因素导致的缺陷识别困难、漏检和误检率高的问题,提出一种改进YOLOv10n的光伏电池缺陷检测算法。首先,剔除原C2f的Bottleneck结构,设计PMSFA_CSP模块作为主干和颈部网络的部分特征提取模块,通过其部分多尺度特征提取及残差结构获取上下文信息的能力,增强网络对缺陷特征的融合能力。其次,利用不同膨胀率的共享卷积层及SENetV2聚合稠密层注意力机制,设计FPSC_SENetV2模块引入主干网络,减少局部信息丢失,增强网络对细节特征的捕捉能力。再次,融合FreqFFPN与PMSFA_CSP模块,设计FreqFP_FPN模块并引入特征金字塔网络,降低类别不一致性,增强高频细节的缺陷信息;最后,构建SESN损失函数作为边界框回归损失函数,平衡不同尺度缺陷的检测,加速网络收敛,提高计算效率。实验结果表明:将改进的YOLOv10n在光伏电池缺陷数据集上进行实验,相较原算法mAP@0.5提高3.0%;计算量降低0.7 GFLOPs;参数量降低0.08 M;综合性能满足光伏电池缺陷检测要求。
2025, 48(15):63-69.
摘要:为了拓宽深度孤立森林(DIF)算法的应用领域。本文将深度学习预训练DenseNet121模型和DIF算法相结合,提出了一种DenseNet深度孤立森林(DDIF)算法用于探索该方法在工业图像异常检测数据集MVTec AD上的应用效果。但是经DenseNet-121模型特征提取后特征向量维度相当高,在随机选择数据属性构建树时可能存在数据集中某些重要特征属性无法被选中的问题,因此本文又提出一种基于特征分组深度孤立森林(GDIF)算法并用在表格型数据集上。最后,在DDIF算法的基础上结合GDIF算法得到DenseNet特征分组深度孤立森林算法(DGDIF),解决了高维数据重要特征漏选问题。实验选取不同的数据集进行异常检测,发现DDIF方法在15个图像数据集中有9个优于其他基于深度学习的方法;GDIF方法在9个表格数据集中较其他传统经典的异常检测算法表现出更优的AUROC值;DGDIF方法在15个图像数据集中有9个优于不引用特征分组的DDIF方法。实验结果验证了所提出的GDIF算法,DDIF算法和DGDIF算法的有效性。
2025, 48(15):70-79.
摘要:针对液晶显示屏(LCD)表面缺陷特征微弱、种类繁多且与背景相似度较高,导致现有检测方法精度较低的问题,提出了一种基于YOLOv10的改进液晶显示屏微弱缺陷检测模型—LC-YOLO。首先,将颈部网络上的卷积模块更改为全维动态卷积ODConv,在保证模型检测精度的同时降低了模型的计算量,提高对小缺陷特征信息的精确提取。其次,为进一步优化模型的性能,提出DySample动态上采样模块。通过点采样的方式避免背景的干扰,减少了误检和漏检现象。提高了模型在复杂背景下的鲁棒性。最后,为了增强模型对小目标的提取能力,本文引入了添加EMAttention注意力机制。该机制增强了模型对小型和暗淡目标的关注能力,从而显著提高了模型整体性能。在包含划痕、崩角、凹印3类缺陷的1 774张数据集上进行的实验结果表明,与原YOLOv10模型相比,LC-YOLO在平均精度、准确率和召回率上分别提高了2.9%、2.4%和5.8%。同时,模型的计算量也减少了2%。与现有的目标检测算法相比,LC-YOLO在保持轻量化特性的同时,精度和检测速度也获得了提升,且在液晶屏表面微弱特征缺陷的检测中表现出优异的性能。
2025, 48(15):80-90.
摘要:针对森林火灾初期检测领域中环境背景复杂、小目标火焰和烟雾纹理特征不明显、模型参数量大、实际部署计算资源受限的问题,提出基于改进YOLOv5s的轻量化森林火灾初期检测算法YOLO-VRG。首先,使用极简主义网络VanillaNet作为特征提取网络,以显著降低模型复杂度,实现高效特征提取;其次,设计了空间特征和特征通道重建注意力卷积RVBC3EMA模块,以减少空间和通道维度上的特征冗余,提高特征表达能力;最后,充分利用分组混洗卷积以进一步降低模型参数量和计算量。实验结果表明:YOLO-VRG模型相比于原始模型,mAP@0.5达到了87.6%,提升了3.2%的同时,模型参数量减少了74.1%,GFLOPs降低了71.9%,仅有2.1 M的参数量和4.5的GFLOPs,该算法在提高检测精度的同时大幅度减少了模型参数量,能更好的适用于计算资源受限的场景。
2025, 48(15):91-100.
摘要:基于多示例学习框架的远程监督关系抽取方法大多依赖于启发式生成的污染标签,侧重于在句袋级别进行关系预测。然而,这些方法在句子级别的预测中表现不佳,而句子级别的预测更适用于理解性任务,如问答和知识图谱补全。为解决上述问题,本文提出了一种新型的远程监督关系抽取方法,该方法通过正负学习在句子级别训练模型,以区分噪声数据并加速收敛。同时,构建了一个约束图,用于编码关系与实体类型之间的约束,并通过辅助损失向关系原型优化,从而实现不同关系之间的信息传播,使得模型能够学习到更为本质且可解释的句子表示。本文方法不仅能够识别噪声数据,还可以通过迭代修正其标签,以改进远程数据的质量,进一步提高模型性能。本方法在NYT数据集的句子级关系抽取任务中表现出色,精确度达77.69%,较当前最优基准模型提升6.47%,在噪声标注测试集上的F1分数高达85.88%,验证了其卓越的去噪能力。消融实验结果表明,约束图对关系原型优化的贡献为11.02%。实验结果表明,该方法在句子级别的关系抽取任务中显著优于现有方法,不仅有效减少了噪声影响,还显著提升了模型性能,为远程监督关系抽取任务提供了一个高效的解决方案。
2025, 48(15):101-109.
摘要:为降低谐波和间谐波检测时频谱泄露和栅栏效应引起的测量误差,同时解决数据传输和存储困难的问题,本文提出基于Nuttall窗压缩感知与插值技术的谐波和间谐波检测方法,并搭建了谐波检测实验平台。首先,将4项3阶Nuttall窗融入到压缩感知的压缩采样过程中,实现信号的加窗压缩采样;其次,利用稀疏度自适应匹配追踪算法对经压缩采样后的稀疏向量进行重构估计,并使用三谱线插值技术对其进行修正得出信号参数检测结果;最后,搭建实验平台对理论正确性与实际可行性进行验证。结果表明,所提方法在压缩比为50%时,对频率、幅值、相位的最大相对误差分别为-0.008%、-0.42%和1.37%,实现对谐波和间谐波特征参数的准确测量,同时大大缓解了数据处理负担。在硬件实验中,谐波信号的频率和幅值测量的最大绝对误差分别为0.026 1 Hz和0.080 5 V,验证了所提方法的有效性和可行性。
2025, 48(15):110-119.
摘要:针对自闭症诊断研究中脑网络建模过程存在的多尺度特征挖掘不充分、皮尔逊相关算法的功能连接估计不准确等问题,提出了一种基于多尺度自注意力图卷积网络MS-SAGCN的自闭症诊断算法框架。首先,使用Morlet小波变换与动态时间规整,提取大脑血氧水平依赖信号的时频信息与基于此信息的多尺度功能连接,随后,通过预训练嵌入模型增强时频特征,与功能连接组合为多尺度脑网络。最终,使用MS-SAGCN对数据进行融合增强,以实现自闭症患者的自动诊断。通过ABIDE数据集进行实验验证,结果表明,MS-SAGCN可有效增强多尺度脑网络,总体框架在分类任务中取得了95.1%准确率、97.4%真阳率和94.9%的F1分数,显著优于其他诊断模型,体现了该模型良好的应用前景。
2025, 48(15):120-128.
摘要:本研究提出了一种基于Conformer-LSTM模型的连续无创血压预测方法,模型包括卷积支路、Transformer支路、两个多尺度交叉注意力模块、自适应空间特征融合模块和两层LSTM。通过该方法,仅通过输入PPG信号即可预测对应的ABP波形,收缩压和舒张压通过预测的ABP波形得出。此外,该方法在较大的数据集中取得较小的预测误差,实验结果表明,本文提出的模型在MIMIC数据集中预测的ABP波形与实际波形的拟合程度较好,SBP和DBP的预测误差分别为(3.68±5.60) mmHg和(2.16±3.72) mmHg,该方法符合美国医疗仪器促进协会(AAMI)标准,并在英国高血压协会(BHS)标准中获得A级评价。
2025, 48(15):129-140.
摘要:为了解决现有的船舶检测算法参数量与计算量较大,以及尺度和视角变化导致检测结果波动的问题,提出一种改进YOLOv8n的轻量化内河船舶检测算法YOLO-LISD。首先,设计融合细节增强卷积的高效特征共享检测头替换原检测头,提升检测一致性;其次,引入slim-neck方法改进颈部网络,在保证检测性能前提下缩小模型体积;再次,提出全局通道自适应幅度剪枝算法深度压缩模型,提升检测效率;最后,设计基于空间和通道相关性的特征知识蒸馏,提高剪枝后模型的检测精度。实验结果表明,YOLO-LISD相比YOLOv8n模型参数量与计算量分别减少68.4%与56.8%,在SeaShips数据集上检测的准确率与mAP50:95分别提高1.1%和2.1%。实际应用中,在低算力设备上检测速度达到55 fps,满足实时性要求。与其他算法对比展现明显优势,验证了该方法的优越性。
2025, 48(15):141-149.
摘要:目前基于深度学习的立体匹配网络虽然具备较高的精度,但是网络中复杂的结构导致计算时间的急剧增加。为了平衡网络的匹配速度与精确度,本文提出了基于选择性融合上下文信息的立体匹配网络。首先,通过相关层方法构建成本体,进而在聚合模块中采用单编码器解码器结构,以降低模型复杂度。其次,在编码器中融合多尺度成本体,以捕捉不同层级的视差信息;同时,在解码器中设计选择性融合上下文信息模块,利用参考图像的上下文特征引导几何信息的高质量解码。最后,设计多分支聚合金字塔池化模块,增强编码-解码模块理解全局语境的能力。实验结果表明,本文算法在KITTI2015数据集上全部区域的误匹配率为1.97%,在KITTI2012数据集上的三像素误差为1.50%。与其他算法相比,在满足算法实时性要求的同时,实现了更精准的立体匹配精度。
2025, 48(15):150-158.
摘要:鼻中隔解剖结构的精准分割对病症评估及手术规划具有重要临床价值,然而现有基于卷积神经网络(CNN)的方法在全局特征表征方面存在局限性。为此,本研究创新性地构建CTA-Net模型,通过双分支编码架构实现局部-全局特征协同学习:CNN分支捕捉解剖结构细节特征,Transformer分支建模长距离空间依赖关系,并设计特征融合模块实现特征信息交互。特别在瓶颈层引入多尺度特征注意力机制,通过自适应感受野调整增强模型对复杂解剖结构的表征能力。实验验证采用自主标注的鼻中隔临床数据集及ISIC 2018、Kvasir共3个医学数据集进行对比实验,结果显示本模型在鼻中隔分割任务中IoU和Dice分别达到90.38%和94.94%。在跨数据集对比实验中,胃肠镜图像分割任务上的IoU精度达76.17%,显著优于其他现有模型,证实了模型在特征学习能力和泛化适应性方面的优势。本研究为医学图像分析提供了一种融合局部感知与全局建模的创新性解决方案,在耳鼻喉科智能诊疗领域具有重要应用前景。
2025, 48(15):159-167.
摘要:在复杂的水下环境中,针对传统YOLO目标检测方法检测性能差等问题,提出一种基于改进YOLO11的水下目标检测模型。首先,通过引入上下文引导模块CGBD,采用多尺度特征提取器增强网络捕获能力;其次,为解决网络中特征冗余导致参数量过大的问题,设计轻量化高效聚合模块RGCSPELAN为模型减负;针对原有检测头定位识别能力不足且计算成本较高的问题,通过融合重参数化策略与细节增强卷积构建轻量高效的DEC-Head检测头。此外采用Wise-Inner-MPD损失函数提升模型的泛化能力并加速收敛。在URPC数据集中的实验结果表明,相较于基准模型YOLO11,本文提出的方法在mAP50和mAP50-90平均精度均值上分别提升了2.4%和2.1%。并且在RUOD数据集的实验结果中,本文所改进模型平均精度均值mAP50相比YOLO11提升了1.3%,召回率R提升了1.5%,较其他主流检测方法能够展现出更优的水下目标检测性能。
2025, 48(15):168-176.
摘要:针对传统检测方法对风力发电机表面缺陷检测能力不足的问题,本文提出一种基于SAFPNYOLO的风机表面缺陷检测算法。首先,针对航拍目标多尺度的问题,使用基于渐近融合思想的SAFPN网络替代了经典的特征金字塔融合网络,减小特征融合时信息的语义差距;其次,为了应对检测背景信息冗余的问题,在算法主干网络的深层嵌入改进的卷积模块替换原有的SCDown模块,使得模型保留对局部特征关键信息的同时,在更广阔的视野范围内提取特征;最后,为了解决纹理型缺陷难以检测与定位的问题,提出了一种可以加强空间特征交互能力和特征表达能力的注意力机制,进一步改善模型的检测性能。实验结果表明,基于SAFPN-YOLO的风机表面缺陷检测算法的mAP50达到了82.4%,相较于基线模型提高了3.3%,能够实现更加准确的风机表面缺陷检测。
2025, 48(15):177-184.
摘要:针对水下复杂环境中常见的低光照、颜色失真和模糊等图像退化问题,本文提出了一种基于多输入融合的图像增强模型。首先,通过融合白平衡处理的标准水下输入图像和对比度增强的降噪输入图像,利用图像退化信息,仅依赖原始图像生成相应的权重,有效应对水下介质带来的限制性影响。然后设计了4种权重图,针对光散射和吸收导致的远处物体能见度下降问题进行优化,优化图像的整体视觉质量和细节表现力。最后,通过多尺度融合过程,模型在不同尺度上逐层融合特征,减少伪影并增强图像细节。实验结果表明,所提模型在UIEB、EUVP和RUIE数据集上,UCIQE、UIQM和信息熵的平均值分别为0.660 3、4.556 9、7.434 1,与其他典型及新颖算法相比,所提模型在色彩失真校正、丰富细节缺失、对比度增强、主观视觉判断方面均表现优异,验证了该方法在水下图像增强中的优越性和鲁棒性。
2025, 48(15):185-198.
摘要:针对YOLO11在课堂行为检测中存在复杂细节丢失、多尺度感知能力不足、计算效率低以及检测精度低的问题,提出了一种改进的ATDW-YOLO算法。首先,在颈部网络中构建了自适应极化特征融合模块,提升特征语义融合能力,更好地捕捉复杂细节。其次,设计了任务动态对齐检测头模块,提高模型在多尺度目标上的识别能力。然后,在主干网络中引入动态分组卷积混洗转换模块,增强特征表示能力,实现网络轻量化。最后,采用Wise-IoU函数替代CIoU损失函数,改善边界框的拟合能力,提高检测精度。实验结果表明,与YOLO11n模型相比,ATDW-YOLO的mAP0.5和mAP0.5:0.95分别提高了3.1%和4.0%,而模型参数量、计算量和模型大小分别降低了23.1%、9.5%和23.6%,显著提升了检测精度,实现网络轻量化。

主编:孙圣和
创刊:1980年
ISSN:1002-7300
CN:11-2175/TN
国内邮发代号:2-369