摘要
提出一种改进YOLOv7的纸张表面缺陷一步式检测算法。首先将注意力机制模块CBAM融合到主干和特征提取网络结构,从空间和通道2个维度提取信息,提升小目标纸病特征提取准确性和算法稳定性;将ASPP空洞卷积加入主干网络SPP中,ASPP可以进一步扩大感受野,使较小目标的特征信息在网络传递时得到保留,解决了小目标信息量不足的问题,进而提高小目标纸病识别的性能。通过自制纸病数据集检测实验,与YOLOv7相比,精确率、召回率及平均精确率均值mAP 0.5分别提升了1.5、2.3和2.1个百分点。
在纸张的生产过程中,受生产工艺及现场环境等影响,纸张表面容易出现裂缝、孔洞、黑斑、线条、褶皱等缺陷或异常。本课题将超出预期模式范围数据的纸张表面缺陷统称为纸
为了在保障一定速度的情况下,提高小目标纸病检测精确率,本课题在研究YOLO系
在COCO公开数据集上5~160 帧/s的FPS范围内,YOLOv7深度学习目标检测算法的检测精度和检测速度均超过了目前所有的目标检测算
YOLO系列网络均基本由3个部分组

图1 YOLOv7模型结构图
Fig. 1 Structure of YOLOv7 model
正常的卷积对图片中的物体提取特征时,并不特别关注部分重要的信息,而是把所有的信息当成相同权重进行处理,导致许多重要信息的损失。为了提升YOLOv7对于小目标纸病的检测能力,在YOLOv7的主干网络特征提取部分,将注意力机制模块CBAM加入其中,再将ASPP空洞卷积加入主干网络的SPP中,能在不丢失图像分辨率的情况下扩大特征图的感受野,提高分辨率,进而精确定位纸病目标,有利于纸病缺陷目标的提取,而不同的感受野可以感受不同的尺度信息,实现不同大小纸病缺陷目标检测及识别。
加入注意力机制能够抑制无关信息的干扰,保留待检测目标的更多关键特征,使网络关注到更多小目标纸病,提高检测精度。利用空间注意力机制有助于明确小目标位置,利用通道注意力机制可建模特征通道的重要程度,CBAM同时关注了空间和通道维度特征,对于小目标纸病缺陷检测效果更
给定一个中间特征图后,CBAM模块会沿着2个独立的维度(通道和空间)依次推断注意力图,然后将注意力图乘以输入特征图以进行自适应特征修饰。通道上,将输入的特征图F(H×W×C)分别经过基于宽度、高度的全局最大池化和全局平均池化,得到2个1×1×C的特征图;再将其分别送入1个2层的神经网络(MLP),第1层神经元个数为C/r(r为减少率),激活函数为ReLu,第2层神经元个数为C,这个2层的神经网络是共享的;而后,将MLP输出的特征进行加和操作,再经过激活函数,生成最终的通道特征,即Mc;最后,将输出Mc的和输入特征图F相乘,生成空间特征模块需要的输入特征。空间上,将通道特征模块输出的特征图F作为本模块的输入特征图。首先设置1个基于通道的全局最大池化和全局平均池化,得到2个H×W×1的特征图,将这2个特征图基于通道做通道拼接;然后经过一个7×7卷积,降维为1个通道,即H×W×1;再经过激活函数生成空间特征,即Ms;最后将该特征和该模块的输入特征做乘法,得到最终生成的特征。通道上模块具体计算如式(1)~

图2 CBAM结构图
Fig. 2 Structure of CBAM
(1) |
(2) |
(3) |
(4) |
式中,σ为激活函数Sigmoid;,;为7×7的卷积。
利用CNN提取图像特征时,随着卷积层数的加深,特征图分辨率逐渐减小,局部感受野能感知到原图像的范围不断扩大,且越接近顶层的特征图越倾向于关注图像的全局信息,所以深层神经网络提取的深层特征非常不利于小目标检测。引入ASPP可以进一步扩大感受

图3 ASPP结构图
Fig. 3 Structure of ASPP
改进后的YOLOv7主干网路部分,在第1、2、3个Conv2D+BN+SiLU模块和第1个Multi_Concat_Block模块后面分别添加1个CBAM模块。前2个CBAM是在浅层网络加入,可以提升网络对于小目标纸病缺陷特征提取能力。第3个CBAM模块作用是在进行下一次特征融合之前,先对特征图进行特征加强操作。通过该改进,能使网络忽略无关纸病信息的干扰,着重关注关键纸病特征,并将相对重要的特征加以融合,使融合后的特征图包含更多有效纸病信息,提高小目标纸病定位精度。特征提取部分CBAM从空间和通道2方面加强了关键纸病信息的检测,保障算法稳定性。
在主干网路里面加入ASPP可以进一步扩大感受野,使较小目标纸病的特征信息在网络传递时得到保留,进而提高网络性能。有利于小目标纸病的识别。改进后YOLOv7网络如

图4 改进YOLOv7算法结构
Fig. 4 Improved YOLOv7 algorithm structure
本课题所有模型实验环境为Linux系统,ubuntu118.04,anconda4.12.0 & python3.8,CUDA11.6;软件采用Pycharm2022.1.1;框架pytorch1.12。GPU为24 GB显存的NVIDIA GeForce RTX 3090,CPU为Gold 5218R。
精确率(P)、召回率(R)、平均精确率(AP)及平均精确率均值(mAP)作为网络的性能评判指标。在工厂检测纸张表面缺陷需要满足实时性,使用单张图片平均推断时间作为评价指标。在检测准确性评价指标方面,本课题选择在目标检测领域中常用mAP 0.5和mAP 0.5:0.95指标,mAP计算如
(5) |
其中,AP为精确率-召回率(P-R)曲线的曲线下面积。在计算P的过程中,首先设定预测框与真实框交并比(Intersection of Union,IoU)阈值,然后绘制预测框的P-R曲线,计算AP值。mAP 0.5指IoU阈值取50%时的mAP值。此外,将阈值从50%开始,以5%为步长逐渐升高至95%,得到不同IoU阈值下的mAP,mAP 0.5:0.95即为所有mAP的平均值。
研究中采用2种方式采集纸病图像,分别从包装纸生产车间生产线上采集实际遇到的纸病和从实验室中通过实验室设备采集的纸张纸病。包装纸生产车间生产线上收集到的纸病图像是纸病诊断系统经过裁剪处理后的图像,实验室采集到的纸病图像是相机拍摄的原图,这些纸病图像大部分图片的长度和宽度不一样,为了统一图片尺寸大小并防止图片失真,采用背景插值法和图像外接矩形区域法对图片进行缩放。本课题纸病数据集一共有3500张图片,包含了黑斑、亮斑、孔洞、折皱、裂缝5类纸病,部分原始纸病图像数据如

图5 原始纸病图像数据
Fig. 5 Paper disease image data
所有采集的图像首先进行了图像缩放、翻转、长宽扭曲等数据处理,以增加训练样本的多样性、扩大纸病数据集规模;然后用labelimg软件标注出目标区域及类别,纸病类别一共有5类,分别为黑斑、白斑、孔洞、裂口、褶子。通过执行Python脚本课题件把数据集按数量比8∶2划分生成训练集和验证集。执行完结果在VOCdevkit/VOC2007目录下生成文件夹YOLOLabels,存放的文件是图像的YOLO格式的标注文件,在VOCdevkit目录下生成images和labels文件夹,images文件夹里有train和val文件夹,分别放置训练集和测试集图片;labels文件夹有train和val文件夹,分别放置训练集和测试集标签(YOLO格式),在YOLOvX下生成了2个文件YOLOvX_train.txt和YOLOvX_val.txt。YOLOvX_train.txt和YOLOvX_val.txt是分别存放的训练图片文件和测试图片文件的列表,含有每个图片的路径和文件名。
为方便比较,设计了消融实验来验证改进效果,改进后的YOLOv7消融实验结果如
方法 | mAP 0.5/% | FPS/帧· |
---|---|---|
YOLOv7 | 91.8 | 90.0 |
YOLOv7+CBAM | 93.2 | 84.0 |
YOLOv7+ASPP | 92.7 | 86.0 |
YOLOv7+CBAM+ASPP | 93.9 | 78.1 |
为了证明改进后的算法性能,
方法 | P/% | R/% | mAP 0.5/% | mAP 0.5:0.95 | FPS/帧· |
---|---|---|---|---|---|
YOLOv7 | 92.3 | 89.8 | 91.8 | 0.524 | 90.0 |
YOLOv7+CBAM+ASPP | 93.8 | 92.1 | 93.9 | 0.541 | 78.1 |
为了更好地验证所提出的改进YOLOv7算法的检测性能,采用检测准确率与检测时间2项指标,将本课题的改进YOLO算法同现有基于CNN的纸病分类算法与其余主流目标检测网络模型SSD、YOLOv5在自建数据集上的训练结果进行评估与对比,对比实验的结果如
算法 | mAP 0.5/% | FPS/帧· |
---|---|---|
SSD | 90.4 | 40.0 |
YOLOv5 | 90.8 | 39.9 |
YOLOv7 | 91.8 | 90.0 |
YOLOv7+CBAM+ASPP | 93.9 | 78.1 |
通过纸病数据集对改进YOLOv7模型进行训练,纸病数据集训练结果图如

图6 纸病数据集训练结果图
Fig. 6 Training result graphs for paper detect dataset
改进后的YOLOv7算法检测结果如

图7 改进后的YOLOv7 算法检测结果
Fig. 7 Detection results of the improved YOLOv7 algorithm
本课题通过在YOLOv7网络中加入注意力机制CA和BAM及空洞空间卷积池化金字塔ASPP,提升了网络对纸病检测的精度,其平均精确率均值mAP 0.5提升了2.1个百分点,检测速度超过78帧/s,且模型具有较好的鲁棒性,具有较高的纸病缺陷在线检测应用价值。研究中只检测了常见的5类纸病,后期可增加更多纸病类型;由于没有开源的纸病数据集,纸病数据集数量仅3500张左右,导致训练模型的泛化性能不高,后期可采集更多的纸病图像,丰富数据集的规模;同时,可以考虑通过迁移学习策略提高纸病特征学习及检测效率;并对纸病进行预处理,放大小目标图像,进一步提高检测效率。
参 考 文 献
罗东亮, 蔡雨萱, 杨子豪, 等. 工业缺陷检测深度学习方法综述[J]. 中国科学(信息科学), 2022, 52(6): 1002-1039. [百度学术]
LUO D L, CAI Y X, YANG Z H, et al. Survey on Industrial Defect Detection with Deep Learning[J]. Scientia Sinica(Informationis), 2022, 52(6): 1002-1039. [百度学术]
周强, 陈颖, 沈天宇, 等. 基于机器视觉的纸病检测系统发展综述[J]. 中国造纸, 2016, 35(5): 72-79. [百度学术]
ZHOU Q, CHEN Y, SHEN T Y, et al. Review on the Development of Paper Defect Detection System Based on Machine Vision Technology[J]. China Pulp & Paper, 2016, 35(5): 72-79. [百度学术]
赵晓, 何立风, 姚斌, 等. 一种基于连通域标记的纸病检测算法[J]. 中国造纸学报, 2018, 33(2): 51-56. [百度学术]
ZHAO X, HE L F, YAO B, et al. Algorithm of Paper Defect Detection Based on Connected-component Labeling[J]. Transactions of China Pulp and Paper, 2018, 33(2): 51-56. [百度学术]
雷扬博, 黄勋, 王阳阳, 等. 马尔可夫随机场在纸病检测中的应用研究[J]. 中国造纸, 2019, 38(5): 50-56. [百度学术]
LEI Y B, HUANG X, WANG Y Y, et al. Research on the Application of Markov Random Field in Paper Disease Detection[J]. China Pulp & Paper, 2019, 38(5): 50-56. [百度学术]
魏晓燕. 基于机器视觉的纸病检测系统设计[J]. 造纸科学与技术, 2021, 40(3): 77-80. [百度学术]
WEI X Y. Design of Paper Disease Detection System Based on Machine Vision[J]. Paper Science & Technology, 2021, 40(3): 77-80. [百度学术]
张璐. 基于人工智能背景下动态识别技术分析在造纸领域中的应用研究[J]. 造纸科学与技术, 2020, 39(1): 63-67. [百度学术]
ZHANG L. Research on the Application of Dynamic Identification Technology Analysis in the Field of Papermaking Based on the Background of Artificial Intelligence[J]. Paper Science & Technology, 2020, 39(1): 63-67. [百度学术]
高乐乐, 周强, 王伟刚. 基于CNN的深层次特征提取纸病辨识方法研究[J]. 中国造纸学报, 2019, 34(4): 52-58. [百度学术]
GAO L L, ZHOU Q, WANG W G. Paper Defects Recognition Based on Deep Layer Feature Extraction of CNN[J]. Transactions of China Pulp and Paper, 2019, 34(4): 52-58. [百度学术]
冯雨. 基于卷积神经网络的纸病识别算法研究[J]. 造纸科学与技术, 2021, 40(4): 72-76. [百度学术]
FENG Y. Research on Paper Defect Recognition Algorithm Based on Convolution Neural Network[J]. Paper Science & Technology, 2021, 40(4): 72-76. [百度学术]
曲蕴慧, 汤伟, 成爽爽. 基于深度卷积神经网络及迁移学习的纸病分类方法研究[J]. 中国造纸, 2021, 40(10): 63-70. [百度学术]
QU Y H, TANG W, CHENG S S. Paper Disease Classification Based on Deep Convolutional Neural Network and Transfer Learning[J]. China Pulp & Paper, 2021, 40(10): 63-70. [百度学术]
毛艳玲, 李天宇, 吴浩, 等. 改进蝙蝠算法在纸病图像增强中的应用[J]. 四川轻化工大学学报(自然科学版), 2022, 35(2): 54-62. [百度学术]
MAO Y L, LI T Y, WU H, et al. Application of Improved Bat Algorithm Optimization in Paper Defect Image Enhancement[J]. Journal of Sichuan University of Science & Engineering(Natural Science Edition), 2022, 35(2): 54-62. [百度学术]
张开生, 关凯凯. 基于改进YOLOv5的纸病检测方法[J]. 中国造纸, 2022, 41(10): 79-86. [百度学术]
ZHANG K S, GUAN K K. Paper Defect Detection Method Based on Improved YOLOv5[J]. China Pulp & Paper, 2022, 41(10): 79-86. [百度学术]
王欣, 江涛, 马珍, 等. 基于改进YOLOv3-Tiny的遥感舰船小目标检测方法[J]. 计算机时代, 2023(3): 111-115. [百度学术]
WANG X, JIANG T,MA Z, et al. Small Target Detection of Remote Sensing Ship Based on Improved YOLOv3-Tiny Algorithm[J]. Computer Era, 2023(3): 111-115. [百度学术]
秦强强, 廖俊国, 周弋荀. 基于多分支混合注意力的小目标检测算法[J/OL]. 计算机应用: 1-9[2023-11-08].http://kns.cnki.net/kcms/detail/51.1307.TP.20230316.1610.012.html. [百度学术]
QIN Q Q, LIAO J G, ZHOU Y X. Small Object Detection Algorithm Based on Split Mixed Attention[J/OL]. Journal of Computer Applications: 1-9[2023-11-08].http://kns.cnki.net/kcms/detail/51.1307.TP.20230316.1610.012.html. [百度学术]
Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, 2016: 779-788. [百度学术]
WANG C Y, BOCHKOVSKIY A, LIAO H Y M. YOLOv7: Trainable Bag-of-freebies Sets New State-of-the-art for Real-time Object Detectors[EB/OL]. Computer Vision and Pattern Recognition, [2023-4-10].https://arxiv.org/abs/2207.02696. [百度学术]
REDMON J,FARHADI A. YOLOV3 : An Incremental Improvement[C]//IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake Cily: IEEE Computer Society, 2017: 7263-7271. [百度学术]
WOO S, PARK J, LEE J Y, et al. Cbam: Convolutional Block Attention Module[C]//Proceedings of the European Conference on Computer Vision (ECCV). Munich, 2018: 3-19. [百度学术]
CHEN L C, PAPANDREOU G, KOKKINOS I, et al. Deep Lab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs[J]. IEEE Transactions on Pattern Analysis and Machine In Telligence, 2018, 40(4): 834-848. CPP [百度学术]