网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于改进YOLOv7的小目标和低对比度纸病分类算法研究

  • 汤伟 1
  • 周国庆 1
  • 王孟效 2
  • 方嘉楠 3
  • 张龙 4
  • 郑晓虎 1
  • 刘英伟 1
1. 陕西科技大学电气与控制工程学院,陕西西安,710021; 2. 陕西西微测控工程有限公司,陕西咸阳,712081; 3. 西安金路交通工程科技发展有限责任公司,陕西西安,710077; 4. 西安小米通讯技术有限公司,陕西西安,710061

中图分类号: TS736+.2

最近更新:2025-03-24

DOI:10.11980/j.issn.0254-508X.2025.03.018

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

随着纸机车速提升和幅宽加大,纸病出现频率随之上升。为根治纸病,需对其有效分类以溯源。但因部分纸病目标小、对比度低,分类效果欠佳。本课题提出了一种基于改进YOLOv7的分类方法,核心思想是在颈部网络改良快速跨阶段特征金字塔池化(SPPFCSPC)模块,在感受野不变前提下提升分类速度;使用空间深度卷积替换原有的“卷积+池化层”,增强对纸病的特征提取能力;通过注意力模块(SimAM),使更多的资源集中于纸病细节,进一步提高低对比度和小目标纸病的识别效率。结果表明,本课题算法的平均精度达0.97,实时检测速度26.5帧/s。相比于原YOLOv7网络,本算法在小目标和低对比度纸病的平均精度和检测速度方面均有明显提升。

在纸张抄造过程中,受制造工艺或生产环境影响,纸张表面可能会出现不同种类的瑕疵,如孔洞、黑点、划痕和起皱等,行业内统称为纸病。纸病的出现会对纸张的加工性能和企业经济效益产生一定程度的负面影响,需尽可能地克服或消[

1]。为从根源解决纸病问题,需要对纸病进行分类,为纸病溯源提供技术支持。然而,在纸病分类过程中,存在纸病与纸张图像的尺寸比例<0.1的小目标纸[2-3],以及对比度低于10∶1的低对比度纸病,导致分类效果欠佳。因此,如何设计一种能兼顾小目标和低对比度纸病的纸病分类方法是一个亟待解决的痛点问题。

随着深度学习的发展,基于机器视觉的分类方法在纸病图像分类领域备受青睐。为了解决纸病图像分类问题,张学兰[

4]提出了一种基于图像变换和BP神经网络的分类方法,利用动态双阈值法对孔洞和脏点图像进行预处理,通过Prewitt算子和形态学闭运算对折痕图像进行预处理,再利用BP神经网络对纸病图像进行分类,最终识别结果的平均准确率达93.8%,具有算法简单易实现的优点;但该研究仅讨论了3种纸病的分类问题,具有一定的局限性,泛化能力弱,且测试样本仅涉及80余个纸病缺陷,样本量较少,导致算法不具有普适性。高乐乐[5]提出了一项采用卷积神经网络(CNN)的纸病识别方法,通过图像增强和图像分割的技术对待检测纸病图像进行预处理,随后利用CNN网络提取纸病特征,并通过Softmax层进行纸病分类,最终识别结果的辨识率为99.6%,具有分类准确率高、识别速度快的优点;但仅通过正确率对结果进行评价,评价指标单一,说服力较弱。张开生[6]提出了一种基于改进YOLOv5的纸病分类方法,在批量归一化模块中引入中心化和缩放校准,在骨干网络结构中融入坐标注意力机制,并使用CIoU_loss作为边框回归的损失函数,所得结果平均精度为99.0%,具有分类精度高的优点;但实验均未采用小目标样本,算法实用性较差。

综上所述,上述方法在分类准确率、评价指标选择、样本选择、泛化性方面均存在一定的不足。本课题受戚玲珑[

7]使用改进YOLOv7模型对公开数据集FloW-Img小目标子数据集检测的启发,以实现小目标、低对比度纸病分类研究为出发点,提出一种基于改进YOLOv7的小目标和低对比度纸病分类方法;同时,通过使用Pytorch平台进行验证,验证本课题所提方法的有效性。

1 基于改进YOLOv7网络的纸病图像分类算法

1.1 传统YOLOv7网络

YOLOv7算法旨在改善目标检测算法在速度上表现出色但精确率较低的问题,结构模型如图1所示。输入端使用了Mosaic数据增强技术、自适应锚框计算和图片尺寸处理进行预处理;骨干网络是特征提取网络,包括3种主要模块,分别为卷积模块(CBS)、最大池化与卷积结合模块(MP)及扩展高效聚合模块(ELAN);颈部网络则采用了路径融合网络(PANet)的方[

8],将骨干网络提取的特征层进行拼接。最终通过3组重参数化卷积(RepConv)模块,并结合引导式标签分配策略,高效匹配了图像与标[9];在输出端以CIoU_loss为损失函数,优化目标边界框,并利用非极大值抑制(NMS)技术,以增强对多个目标框重叠情况的检测能力,输出结果包括预测图像中缺陷位置和分类信息向[10]。但传统YOLOv7模型没有针对小尺寸图像的检测层,也没有采用针对低对比度纸病的注意力机制,存在对小目标、低对比度纸病检测效果比较差的缺点,在实时性方面,虽然已经能够满足大部分生产场合,但是对于实时性要求较高的纸病分类任务还有待提高。

图1  YOLOv7整体布局图

Fig. 1  Overall layout of YOLOv7

为解决上述问题,本课题基于YOLOv7网络提出一种针对小目标、低对比度纸病的网络模型,该模型首先借鉴了YOLOv5[

11]中空间金字塔池化(spatial pyramid pooling-fast,SPPF)的思想,对跨阶段特征金字塔池化(spatial pyramid pooling with cross stage partial connections,SPPCSPC)模块进行优化,得到快速跨阶段特征金字塔池化(spatial pyramid pooling with fast cross stage partial connections,SPPFCSPC)模块,在保持感受野不变的情况下提升分类速度;其次使用空间深度卷[12](space-to-depth non-strided convolution,SPD-Conv)替换原网络中的“卷积+池化层”,提高小目标纸病的特征提取能力;最后通过添加基于相似度的注意力模块(similarity-based attention module,SimAM),使更多注意资源侧重于纸病细节,进一步提高小目标、低对比度纸病识别效率。

1.2 传统YOLOv7算法中SPPCSPC模块的改进

图2表示YOLOv5中的SPPF结构,其将3个5×5的最大池化层进行串联,并将每一层的输出进行融合。受此启发,本课题将YOLOv7中的SPPCSPC模块(图3)改进为SPPFCSPC模块(图4),将SPPCSPC模块中5×5、9×9、13×13 3个不同大小的最大池化并行关系更改为3个5×5的串行关系,只指定1个卷积核,每次池化后的输出作为下一个池化的输入,计算量从原来的((5×5)+(9×9)×(13×13))·W优化至3×(5×5)·W,其中W代表权重,具有计算量小的优点,可以提升纸病分类速度。

图2  SPPF 结构图

Fig. 2  Structure diagram of SPPF

图3  SPPCSPC模块结构图

Fig. 3  Structure diagram of SPPCSPC module

图4  SPPFCSPC模块结构图

Fig. 4  Structure diagram of SPPFCSPC module

1.3 SimAM注意力机制的引入

在纸病分类过程中,相机采集到的划痕、边裂等纸病属于低对比度图像,图像特征易受背景干扰,YOLOv7在深层卷积过程中容易丢失部分特征,造成分类结果出现漏检或误检等情况,故本算法在骨干特征提取网络中引入了SimAM模块,不同于现有的通道(图5(a))或空间注意力(图5(b))模块,仅单独地将特征转化为1D和2D权重;也不同于CBAM注意[

13]图5(c)),需要将1D和2D权重组合为3D权重,浪费时间,SimAM模块可以在不需要额外参数的情况下推导出3D注意力权重,将其加入YOLOv7网络中不仅不会增加网络的复杂度,还可以提高网络对低对比度纸病的提取能力,SimAM结构图如图5(d)所示。

图5  4种常见的注意力机制空间结构图

Fig. 5  Spatial structure diagram of four common attention mechanisms

具体而言,SimAM模块基于著名的神经科学理论优化能量函[

14],在视觉神经科学中,信息承载量最为显著的神经元往往展现出独特的放电模式,这些模式显著区别于其邻近神经元的活动。此外,活跃的神经元具备调节其邻近神经元活动的潜力,通过空间抑制机制来减少或阻止这些邻近神经元的活动,找到一种使这些活动神经元直接且实用的策略,是评估目标神经元与其周围神经元在放电特性上的线性区分度。基于这些神经科学发现,定义能量函数如式(1)所示。

et(wt,bt,y,xi)=(yt-t^)2+1M-1i=1M-1(y0-x^i)2 (1)

式中,t^=wtt+btx^t=wtxi+bttxi的线性变换,表示C·H·W通道在输入特征xR的目标和其余神经元,i为空间维度指数,M=H·W表示通道上的神经元数目,btwt为变换偏置和权重,最小化该等式可有效实现同一通道中目标神经元t和其他神经元之间的线性可分性,即yt=t^y0=x^iyty0用二进制标签处理(即1和-1),并在式(1)中添加正则化因子λwt2。最终能量函数见式(2)~式(6)

et(wt,bt,y,xi)=(1-(wtt-bt))2+1M-1i=1M-1(-1-(wtxt+bt))2+λwt2 (2)
wt=-2(t-μt)(t-μt)2+2σt2+2λ (3)
bt=-12(t+μt)wt (4)
μ^=1Mi=1Mxi (5)
σ^2=1Mi=1M(xi-μ^)2 (6)

由式(2)~式(6)可知,et最小值et*的计算如式(7)所示。

et*=4(σ^2+λ)t-μ^2+2σ^2+2λ (7)

式中,μσ分别表示平均值和方差。

式(7)可知,在较小的能量下,t即神经元和周边神经元之间的差别越大,其重要性也就越[

15]。其中,1/et*代表神经元的重要性。对特征X进行增强处理,具体计算见式(8)

X¯=sigmoid 1EX (8)

式中,X¯表示增强后的特征,sigmoid表示激活函数,E表示et*在所有信道与空间的之和,“⊙”表示阿达玛乘积,X表示输入特征。

1.4 SPD-Conv模块的添加

在当前的CNN体系结构中,“卷积+池化层”是一个常见但存在缺陷的设计,在进行卷积时会导致细粒度信息的丢失,同时特征学习效率也较低。为提高细粒度信息的提取效率,本算法采用SPD-Conv模块替代每一个“卷积+池化层”。

图6为SPD-Conv结构图。如图6所示,SPD-Conv模块由1个空间到深度卷积层和1个卷积层组成。通常情况下,对于任意特征图X,均可按比例下采样。以比例因子scale=2为例,图6(b)为(δδC1)的特征图X,经过下采样得到图6(c)中的4个子图,每个子图为δ2,δ2,C1,再沿着通道维度连接这些子特征图,从而获得图6(d)为δ2,δ2,4C1的特征图X',在空间到深度卷积层后添加1个步长为1的卷积层,将X'转换为δ2,δ2,C2实现特征提取,由此实现的特征提取会增加对细粒度信息的学习能力,提取更多有效的特征信息,提高对小目标纸病的分类准确[

16]

图6  SPD-Conv结构图

Fig. 6  Structure diagram of SPD-Conv

2 实验设计结果及分析

2.1 实验环境搭建

使用本课题所提出的改进YOLOv7网络进行训练,利用随机梯度下降法(SGD)对网络进行参数修正,过程中设置0.001的初始学习率є、0.9的学习动量α和0.000 5的加权衰变速率w,训练次数Epoch为300,单次传递给训练程序的数据样本个数batch_size设置为64,表1为本课题实验环境配置表。

表1  实验环境配置表
Table 1  Experimental environment configuration
环境配置
CPU Intel(R) Xcon(R) Gold 6226R CPU @2.9 GHz
GPU NVIDIA GeForce RTX 3090Ti
深度学习框架 PyTorch1.10.0
操作平台 Ubuntu 20.04
编程语言 Python 3.9
加速 CUDA 11.1
显卡内存 32G

2.2 数据样本结构

本课题的实验数据由3部分组成,第1部分来自陕西科技大学纸病检测实验室,共2 000张纸病图像,图像大小为2 048×512;第2部分来自浙江双元科技股份有限公司,共9 000张纸病图像,图像大小为1 024×1 024;第3部分来自本实验室搭建的小型造纸系统,共2 000张人工纸病图像用来验证算法的泛化性,图像大小为2 048×512。3个部分共获取13 000张纸病图像数据,由于其中大目标纸病数量较少,本实验不对大目标纸病进行研究,去掉大目标纸病后,再抽取其中包括孔洞、黑斑2种高对比度小目标纸病,划痕、褶皱、边裂和人工纸病4种低对比度小目标纸病在内的6种常见纸病图像共12 000张作为基础图像,6种纸病小目标图像如图7所示。在经过对基础图像进行随机噪声、颜色抖动、裁剪和旋转等数据增强处理后,最终获得了经过LabelImg标注的27 000张纸病图数据集,图像以bmp格式保存,标签以txt格式保存,标签样本的分布如表2所示。

图7  6种纸病图像

Fig. 7  Six kinds of paper defects images

表2  标签样本分布表
Table 2  Label sample distribution table ( )
纸病类别样本总数训练验证测试
孔洞 5 838 4 670 584 584
黑斑 4 688 3 750 469 469
划痕 4 920 3 936 492 492
褶皱 4 554 3 644 455 455
边裂 5 000 4 000 500 500
人工 2 000 1 600 200 200

按照8∶1∶1的比例划分数据集,即80%作为训练集,10%作为验证集,10%作为测试集。为了减轻深度学习模型对硬件的巨大压力,将所有尺寸为2 048×512和1 024×1 024的图像均缩放至640×640,以作为训练模型的初始输入,确保在训练网络模型时更高效地利用系统资源。

2.3 评价指标

为实现纸病检测模型的评估,使用目前广泛采用的目标检测评价指标为平均精确率(average precision,AP)与平均精度(mean average precision,mAP)。其中AP代表模型对单类纸病检测的平均准确率,根据召回率R与查准率P确定,RP的计算分别如式(9)式(10)所示。

R=TPTP+FN ×100% (9)
P=TPTP+FP ×100% (10)

式中,TP包括可以正确找到孔洞、黑斑、划痕、褶皱4种纸病的数量,FP包括6种纸病阴性病例的错误分类数量,FN包括4种纸病阳性错误分类数量。

R作为横坐标,每次召回率的最大P作为纵坐标,建立P-R曲线,取积分即可得到各纸病类别的AP,进一步可以得到mAP,以衡量各类纸病上模型对此的检测效果。mAP的计算方式如式(11)所示(Q表示分类总数)。

mAP=i=1QAPiQ (11)

2.4 消融实验分析

为验证本算法的改进效果,本课题设计了如下消融实验,首先设计8组消融实验模型并进行预训练,然后将预训练好的最优权重文件写入测试代码,输入测试集中的2 700张图像,最后输出测试准确率和分类帧率,从网络模型的mAP和检测帧率(FPS)2方面进行对比,结果如表3所示。

表3  基于改进 YOLOv7 的消融实验
Table 3  Ablation experiment based on improved YOLOv7
组别模型AP/%P/%R/%mAPFPS/(帧·s-1)
孔洞黑斑划痕褶皱边裂人工
A YOLOv7 93.4 93.1 90.2 80.6 46.3 96.3 75.4 79.4 0.83 28.2
B YOLOv7+SimAM 95.3 95.7 93.4 89.4 62.5 97.3 87.5 86.7 0.89 25.3
C YOLOv7+SPD-Conv 95.3 95.5 93.3 89.8 59.3 96.6 80.1 81.9 0.88 29.5
D YOLOv7+SPPFCSPC 94.3 95.5 91.7 84.8 61.3 96.2 81.6 83.4 0.87 27.7
E YOLOv7+SimAM+SPD-Conv 96.6 97.7 92.3 91.2 76.7 97.5 93.9 93.1 0.92 26.1
F YOLOv7+SimAM+SPPFCSPC 97.1 96.4 93.5 90.2 74.7 96.5 93.4 93.7 0.91 25.1
G YOLOv7+SPD-Conv+SPPFCSPC 97.6 97.4 93.3 93.2 74.9 99.6 95.4 93.9 0.93 26.9
H

YOLOv7+SimAM+SPD-Conv

+SPPFCSPC(本课题)

97.7 98.5 97.1 96.5 89.6 99.7 96.7 95.0 0.97 26.5

A组代表未改进的YOLOv7,输入尺寸为640×640的样本图像;B组、C组、D组分别代表在未改进的YOLOv7的基础上引入SimAM注意力机制、替换原网络“卷积+池化层”的SPD-Conv模块和替换原网络SPPCSPC模块的SPPFCSPC模块;E组在B组的基础上使用SPD-Conv模块替换“卷积+池化层”;F组在B组的基础上使用SPPFCSPC模块替换SPPCSPC模块;G组在C组的基础上使用SPPFCSPC模块替换SPPCSPC模块;H组在G组的基础上引入了SimAM注意力机制。

表3可知,在YOLOv7网络上分别添加SPD-Conv模块、SPPFCSPC模块和SimAM注意力机制后,B组、C组、D组的mAP分别增加了5.6、5.0和4.0个百分点,添加SPPFCSPC模块和SimAM注意力机制后,网络的检测帧率分别为25.3和27.7帧/s。在此基础上再添加其他模块会导致网络mAP进一步增加,最高可增加8.4%个百分点,F组增加了SimAM注意力模块和SPPFCSPC模块,使得检测帧率为25.1帧/s。H组结合3种改进模块后mAP达到了96.5%,比原始网络增加了13.2%个百分点。结果表明,本课题设计的网络无论对于黑斑、孔洞类高对比度小目标纸病,还是对于边裂、褶皱类低对比度小目标纸病,均有非常明显的分类效果,且对于本课题添加的人工纸病mAP依然能达99.7%,说明改进算法具有良好的泛化性能。图8展示了基于改进YOLOv7模型进行消融实验的mAP曲线。改进YOLOv7网络mAP值达到最高。

图8  基于改进YOLOv7消融实验mAP曲线

Fig. 8  mAP curves based on improved YOLOv7 ablation experiments

表4为将验证集中2 700个纸病分别放入原网络与改进网络的检测结果,改进YOLOv7网络对纸病分类正确数量明显提高,误检数量大幅降低。

表4  检测数目统计结果
Table 4  Statistical results of the number of tests ( )
模型分类正确数误检数
YOLOv7 2 121 579
改进YOLOv7 2 665 35

2.5 对比实验分析

为验证本课题提出的改进网络的适用性和优越性,本课题添加了现有基于CNN的主流算法YOLOv5、Faster RCNN和SSD-VGG 3种网络在本纸病数据上进行对比实验,所得4种网络的混淆矩阵结果如图9所示,对角线部分表示分类准确率。由图9可知,本课题提出的改进YOLOv7在6类纸病上的识别准确率分别为100%、99%、98%、99%、100%和97%。各个网络在黑斑和孔洞2个缺陷的分类精度最高,因为这2种纸病属于高对比度纸病,纸病特征明显;对划痕和边裂2种纸病的分类差距较大,在SSD-VGG网络结构中,由于最终层特征图过小,导致一些小目标的特征信息丢失,从而导致分类结果表现最差。

图9  4种算法的对比实验混淆矩阵

Fig. 9  Comparative experiments on the confusion matrix of four algorithms

4组数据的mAP图如图10所示。由图10可知,本课题的改进YOLOv7在训练次数为300次时,mAP值最高,为0.97,比原始网络高了16.9%,因此,对于纸病分类网络模型的YOLOv5、Faster RCNN和SSD-VGG来说,本课题所提出的改进算法在检测准确率上明显占优。

图10  4种算法的对比实验mAP曲线

Fig. 10  Comparative experimental mAP curves of four algorithms

图11表示4种网络对于6种常见纸病的检测可视化效果图,在检测结果中,所有纸病均被标注了一个边界,以表明其位置和类别。从图11可以看出,SSD-VGG算法和Faster R-CNN算法均存在误检和漏检的情况,如第42张划痕被误检为孔洞,第48张边裂被误检为褶皱,第48张划痕被漏检;YOLOv5算法存在漏检现象,如第48张划痕被漏检;本算法在此16张图像中均未出现漏检和误检现象,说明本算法无论对于孔洞或者黑斑这种高对比度图像,还是对于褶皱和划痕这种低对比度图像,均具有较强的检测精度。

图11  4种算法的可视化结果图

Fig. 11  Visual result plots of four algorithms

3 结论

本课题提出了一种基于YOLOv7的小目标、低对比度纸病分类改进算法。首先将YOLOv7网络中的跨阶段特征金字塔池化(SPPCSPC)模块改进为快速跨阶段特征金字塔池化(SPPFCSPC)模块,在感受野保持不变的情况下提高分类速度;使用空间深度卷积(SPD-Conv)替换原网络中的“卷积+池化层”,提高小目标纸病的特征提取能力;通过添加注意力模块(SimAM)使更多的注意资源侧重于纸病细节,进一步提高对小目标、低对比度纸病的识别效率。结果表明,改进YOLOv7网络平均精度达0.97,对比原始网络增加了16.9%,实时检测帧率为26.5帧/s,与其他网络的各项性能均有不同程度的提升效果,对小目标、低对比度纸病的分类具有良好的泛化能力和鲁棒性。

参 考 文 献

1

曲蕴慧汤伟成爽爽. 基于深度卷积神经网络及迁移学习的纸病分类方法研究[J]. 中国造纸20214010): 63-70. [百度学术] 

QU Y HTANG WCHENG S S. Paper Defects Classification Based on Deep Convolution Neural Network and Transfer Learning[J]. China Pulp & Paper20214010): 63-70. [百度学术] 

2

董刚谢维成黄小龙. 深度学习小目标检测算法综述[J]. 计算机工程与应用20235911): 16-27. [百度学术] 

DONG GXIE W CHUANG X Let al. A Review of Deep Learning Small Target Detection Algorithms[J]. Computer Engineering and Applications20235911): 16-27. [百度学术] 

3

陈钰枚李兆飞侯劲. 改进YOLOv7的纸张表面缺陷检测研究[J]. 中国造纸20234211): 160-168. [百度学术] 

CHEN Y MLI Z FHOU Jet al. Improvement of Paper Surface Defect Detection by YOLOv7[J]. China Pulp & Paper20234211): 160-168. [百度学术] 

4

张学兰李军孟范孔. 一种基于机器视觉的纸病识别方法[J]. 中国造纸学报2013281): 48-52. [百度学术] 

ZHANG X LLI JMENG F K. A Paper Defects Detection Method Based on Machine Vision[J]. Transactions of China Pulp and Paper2013281): 48-52. [百度学术] 

5

高乐乐周强王伟刚. 基于CNN的深层次特征提取纸病辨识方法研究[J]. 中国造纸学报2019344): 52-58. [百度学术] 

GAO L LZHOU QWANG W G. Paper Defects Recognition Based on Deep Layer Feature Extraction of CNN[J]. Transactions of China Pulp and Paper2019344): 52-58. [百度学术] 

6

张开生关凯凯. 基于改进YOLOv5的纸病检测方法[J]. 中国造纸20224110): 79-86. [百度学术] 

ZHANG K SGUAN K K. Paper Defect Detection Method Based on Improved YOLOv5[J]. China Pulp & Paper20224110): 79-86. [百度学术] 

7

戚玲珑高建瓴. 基于改进YOLOv7的小目标检测[J]. 计算机工程2023491): 41-48. [百度学术] 

QI L LGAO J L. Small Object Detection Based on Improved YOLOv7[J]. Computer Engineering2023491): 41-48. [百度学术] 

8

WANG CBOCHKOVSKIY ALIAO H Y. YOLOv7: Trainable Bag-of-freebies Sets New State-of-the-art for Real-time Object Detectors‍[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition20237464-7475. [百度学术] 

9

韩雅洁郝晓丽牛保宁. 小尺寸低对比度的传送带破损检测方法[J]. 太原理工大学学报2025561): 148-156. [百度学术] 

HAN Y JHAO X LNIU B Net al. A Detection Method for Damage of Conveyor Belt with Small Size and Low Contrast[J]. Journal of Taiyuan University of Technology2025561): 148-156. [百度学术] 

10

李志诚曾志强. 基于改进YOLOv3的卷纸包装缺陷实时检测算法[J]. 中国造纸学报2022372): 87-93. [百度学术] 

LI Z CZENG Z Q. A Real-time Detection Algorithm for Web Packaging Defects Based on Improved YOLOv3[J]. Transactions of China Pulp and Paper2022372): 87-93. [百度学术] 

11

ZHENG Z HWANG PREN D Wet al. Enhancing Geometric Factors in Model Learning and Inference for Object Detection and Instance Segmenttion‍[J]. IEEE Transactions on Cybernetics2022528): 8574-8586. [百度学术] 

12

ZHU X KLYU S CWANG Xet al. TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured Scenarios‍[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision20212778-2788. [百度学术] 

13

YANG LZHANG R YLI Let al. Simam: A Simple, Parameter-free Attention Module for Convolutional Neural Networks[C]//International Conference on Machine Learning. PMLR202111863-11874. [百度学术] 

14

WOO SPARK JLEE J Yet al. Cbam: Convolutional Block Attention Module[C]//Proceedings of the European Conference on Computer Vision (ECCV)20183-19. [百度学术] 

15

宁纪锋林靖雅杨蜀秦. 基于改进YOLOv5s的奶山羊面部识别方法[J]. 农业机械学报2023544): 331-337. [百度学术] 

NING J FLIN J YYANG S Qet al. Face Recognition Method of Dairy Goat Based on Improved YOLOv5s[J]. Transactions of the Chinese Society for Agricultural Machinery2023544): 331-337. [百度学术] 

16

朱传军刘荣光成佳闻. 基于SimAM模块与ResNet34网络的混合缺陷检测模型[J]. 现代制造工程20232): 1-9. [百度学术] 

ZHU C JLIU R GCHENG J Wet al. Hybrid Defect Detection Model Based on Simam Module and ResNet34 Network[J]. Modern Manufacturing Engineering20232): 1-9. [百度学术]