摘要
随着纸机车速提升和幅宽加大,纸病出现频率随之上升。为根治纸病,需对其有效分类以溯源。但因部分纸病目标小、对比度低,分类效果欠佳。本课题提出了一种基于改进YOLOv7的分类方法,核心思想是在颈部网络改良快速跨阶段特征金字塔池化(SPPFCSPC)模块,在感受野不变前提下提升分类速度;使用空间深度卷积替换原有的“卷积+池化层”,增强对纸病的特征提取能力;通过注意力模块(SimAM),使更多的资源集中于纸病细节,进一步提高低对比度和小目标纸病的识别效率。结果表明,本课题算法的平均精度达0.97,实时检测速度26.5帧/s。相比于原YOLOv7网络,本算法在小目标和低对比度纸病的平均精度和检测速度方面均有明显提升。
在纸张抄造过程中,受制造工艺或生产环境影响,纸张表面可能会出现不同种类的瑕疵,如孔洞、黑点、划痕和起皱等,行业内统称为纸病。纸病的出现会对纸张的加工性能和企业经济效益产生一定程度的负面影响,需尽可能地克服或消
随着深度学习的发展,基于机器视觉的分类方法在纸病图像分类领域备受青睐。为了解决纸病图像分类问题,张学兰
综上所述,上述方法在分类准确率、评价指标选择、样本选择、泛化性方面均存在一定的不足。本课题受戚玲珑
YOLOv7算法旨在改善目标检测算法在速度上表现出色但精确率较低的问题,结构模型如

图1 YOLOv7整体布局图
Fig. 1 Overall layout of YOLOv7
为解决上述问题,本课题基于YOLOv7网络提出一种针对小目标、低对比度纸病的网络模型,该模型首先借鉴了YOLOv

图2 SPPF 结构图
Fig. 2 Structure diagram of SPPF

图3 SPPCSPC模块结构图
Fig. 3 Structure diagram of SPPCSPC module

图4 SPPFCSPC模块结构图
Fig. 4 Structure diagram of SPPFCSPC module
在纸病分类过程中,相机采集到的划痕、边裂等纸病属于低对比度图像,图像特征易受背景干扰,YOLOv7在深层卷积过程中容易丢失部分特征,造成分类结果出现漏检或误检等情况,故本算法在骨干特征提取网络中引入了SimAM模块,不同于现有的通道(

图5 4种常见的注意力机制空间结构图
Fig. 5 Spatial structure diagram of four common attention mechanisms
具体而言,SimAM模块基于著名的神经科学理论优化能量函
(1) |
式中,和为t与的线性变换,表示C·H·W通道在输入特征x∈R的目标和其余神经元,i为空间维度指数,M=H·W表示通道上的神经元数目,和为变换偏置和权重,最小化该等式可有效实现同一通道中目标神经元t和其他神经元之间的线性可分性,即和,和用二进制标签处理(即1和-1),并在
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
式中,μ和σ分别表示平均值和方差。
由
(8) |
式中,表示增强后的特征,sigmoid表示激活函数,E表示在所有信道与空间的之和,“⊙”表示阿达玛乘积,X表示输入特征。
在当前的CNN体系结构中,“卷积+池化层”是一个常见但存在缺陷的设计,在进行卷积时会导致细粒度信息的丢失,同时特征学习效率也较低。为提高细粒度信息的提取效率,本算法采用SPD-Conv模块替代每一个“卷积+池化层”。

图6 SPD-Conv结构图
Fig. 6 Structure diagram of SPD-Conv
使用本课题所提出的改进YOLOv7网络进行训练,利用随机梯度下降法(SGD)对网络进行参数修正,过程中设置0.001的初始学习率є、0.9的学习动量α和0.000 5的加权衰变速率w,训练次数Epoch为300,单次传递给训练程序的数据样本个数batch_size设置为64,
环境 | 配置 |
---|---|
CPU | Intel(R) Xcon(R) Gold 6226R CPU @2.9 GHz |
GPU | NVIDIA GeForce RTX 3090Ti |
深度学习框架 | PyTorch1.10.0 |
操作平台 | Ubuntu 20.04 |
编程语言 | Python 3.9 |
加速 | CUDA 11.1 |
显卡内存 | 32G |
本课题的实验数据由3部分组成,第1部分来自陕西科技大学纸病检测实验室,共2 000张纸病图像,图像大小为2 048×512;第2部分来自浙江双元科技股份有限公司,共9 000张纸病图像,图像大小为1 024×1 024;第3部分来自本实验室搭建的小型造纸系统,共2 000张人工纸病图像用来验证算法的泛化性,图像大小为2 048×512。3个部分共获取13 000张纸病图像数据,由于其中大目标纸病数量较少,本实验不对大目标纸病进行研究,去掉大目标纸病后,再抽取其中包括孔洞、黑斑2种高对比度小目标纸病,划痕、褶皱、边裂和人工纸病4种低对比度小目标纸病在内的6种常见纸病图像共12 000张作为基础图像,6种纸病小目标图像如

图7 6种纸病图像
Fig. 7 Six kinds of paper defects images
纸病类别 | 样本总数 | 训练 | 验证 | 测试 |
---|---|---|---|---|
孔洞 | 5 838 | 4 670 | 584 | 584 |
黑斑 | 4 688 | 3 750 | 469 | 469 |
划痕 | 4 920 | 3 936 | 492 | 492 |
褶皱 | 4 554 | 3 644 | 455 | 455 |
边裂 | 5 000 | 4 000 | 500 | 500 |
人工 | 2 000 | 1 600 | 200 | 200 |
按照8∶1∶1的比例划分数据集,即80%作为训练集,10%作为验证集,10%作为测试集。为了减轻深度学习模型对硬件的巨大压力,将所有尺寸为2 048×512和1 024×1 024的图像均缩放至640×640,以作为训练模型的初始输入,确保在训练网络模型时更高效地利用系统资源。
为实现纸病检测模型的评估,使用目前广泛采用的目标检测评价指标为平均精确率(average precision,AP)与平均精度(mean average precision,mAP)。其中AP代表模型对单类纸病检测的平均准确率,根据召回率R与查准率P确定,R和P的计算分别如
×100% | (9) |
×100% | (10) |
式中,TP包括可以正确找到孔洞、黑斑、划痕、褶皱4种纸病的数量,FP包括6种纸病阴性病例的错误分类数量,FN包括4种纸病阳性错误分类数量。
将R作为横坐标,每次召回率的最大P作为纵坐标,建立P-R曲线,取积分即可得到各纸病类别的AP,进一步可以得到mAP,以衡量各类纸病上模型对此的检测效果。mAP的计算方式如
(11) |
为验证本算法的改进效果,本课题设计了如下消融实验,首先设计8组消融实验模型并进行预训练,然后将预训练好的最优权重文件写入测试代码,输入测试集中的2 700张图像,最后输出测试准确率和分类帧率,从网络模型的mAP和检测帧率(FPS)2方面进行对比,结果如
组别 | 模型 | AP/% | P/% | R/% | mAP | FPS/(帧· | |||||
---|---|---|---|---|---|---|---|---|---|---|---|
孔洞 | 黑斑 | 划痕 | 褶皱 | 边裂 | 人工 | ||||||
A | YOLOv7 | 93.4 | 93.1 | 90.2 | 80.6 | 46.3 | 96.3 | 75.4 | 79.4 | 0.83 | 28.2 |
B | YOLOv7+SimAM | 95.3 | 95.7 | 93.4 | 89.4 | 62.5 | 97.3 | 87.5 | 86.7 | 0.89 | 25.3 |
C | YOLOv7+SPD-Conv | 95.3 | 95.5 | 93.3 | 89.8 | 59.3 | 96.6 | 80.1 | 81.9 | 0.88 | 29.5 |
D | YOLOv7+SPPFCSPC | 94.3 | 95.5 | 91.7 | 84.8 | 61.3 | 96.2 | 81.6 | 83.4 | 0.87 | 27.7 |
E | YOLOv7+SimAM+SPD-Conv | 96.6 | 97.7 | 92.3 | 91.2 | 76.7 | 97.5 | 93.9 | 93.1 | 0.92 | 26.1 |
F | YOLOv7+SimAM+SPPFCSPC | 97.1 | 96.4 | 93.5 | 90.2 | 74.7 | 96.5 | 93.4 | 93.7 | 0.91 | 25.1 |
G | YOLOv7+SPD-Conv+SPPFCSPC | 97.6 | 97.4 | 93.3 | 93.2 | 74.9 | 99.6 | 95.4 | 93.9 | 0.93 | 26.9 |
H |
YOLOv7+SimAM+SPD-Conv +SPPFCSPC(本课题) | 97.7 | 98.5 | 97.1 | 96.5 | 89.6 | 99.7 | 96.7 | 95.0 | 0.97 | 26.5 |
A组代表未改进的YOLOv7,输入尺寸为640×640的样本图像;B组、C组、D组分别代表在未改进的YOLOv7的基础上引入SimAM注意力机制、替换原网络“卷积+池化层”的SPD-Conv模块和替换原网络SPPCSPC模块的SPPFCSPC模块;E组在B组的基础上使用SPD-Conv模块替换“卷积+池化层”;F组在B组的基础上使用SPPFCSPC模块替换SPPCSPC模块;G组在C组的基础上使用SPPFCSPC模块替换SPPCSPC模块;H组在G组的基础上引入了SimAM注意力机制。
由

图8 基于改进YOLOv7消融实验mAP曲线
Fig. 8 mAP curves based on improved YOLOv7 ablation experiments
模型 | 分类正确数 | 误检数 |
---|---|---|
YOLOv7 | 2 121 | 579 |
改进YOLOv7 | 2 665 | 35 |
为验证本课题提出的改进网络的适用性和优越性,本课题添加了现有基于CNN的主流算法YOLOv5、Faster RCNN和SSD-VGG 3种网络在本纸病数据上进行对比实验,所得4种网络的混淆矩阵结果如

图9 4种算法的对比实验混淆矩阵
Fig. 9 Comparative experiments on the confusion matrix of four algorithms
4组数据的mAP图如

图10 4种算法的对比实验mAP曲线
Fig. 10 Comparative experimental mAP curves of four algorithms

图11 4种算法的可视化结果图
Fig. 11 Visual result plots of four algorithms
本课题提出了一种基于YOLOv7的小目标、低对比度纸病分类改进算法。首先将YOLOv7网络中的跨阶段特征金字塔池化(SPPCSPC)模块改进为快速跨阶段特征金字塔池化(SPPFCSPC)模块,在感受野保持不变的情况下提高分类速度;使用空间深度卷积(SPD-Conv)替换原网络中的“卷积+池化层”,提高小目标纸病的特征提取能力;通过添加注意力模块(SimAM)使更多的注意资源侧重于纸病细节,进一步提高对小目标、低对比度纸病的识别效率。结果表明,改进YOLOv7网络平均精度达0.97,对比原始网络增加了16.9%,实时检测帧率为26.5帧/s,与其他网络的各项性能均有不同程度的提升效果,对小目标、低对比度纸病的分类具有良好的泛化能力和鲁棒性。
参 考 文 献
曲蕴慧, 汤伟, 成爽爽. 基于深度卷积神经网络及迁移学习的纸病分类方法研究[J]. 中国造纸, 2021, 40(10): 63-70. [百度学术]
QU Y H, TANG W, CHENG S S. Paper Defects Classification Based on Deep Convolution Neural Network and Transfer Learning[J]. China Pulp & Paper, 2021, 40(10): 63-70. [百度学术]
董刚, 谢维成, 黄小龙, 等. 深度学习小目标检测算法综述[J]. 计算机工程与应用, 2023, 59(11): 16-27. [百度学术]
DONG G, XIE W C, HUANG X L, et al. A Review of Deep Learning Small Target Detection Algorithms[J]. Computer Engineering and Applications, 2023, 59(11): 16-27. [百度学术]
陈钰枚, 李兆飞, 侯劲, 等. 改进YOLOv7的纸张表面缺陷检测研究[J]. 中国造纸, 2023, 42(11): 160-168. [百度学术]
CHEN Y M, LI Z F, HOU J, et al. Improvement of Paper Surface Defect Detection by YOLOv7[J]. China Pulp & Paper, 2023, 42(11): 160-168. [百度学术]
张学兰, 李军, 孟范孔. 一种基于机器视觉的纸病识别方法[J]. 中国造纸学报, 2013, 28(1): 48-52. [百度学术]
ZHANG X L, LI J, MENG F K. A Paper Defects Detection Method Based on Machine Vision[J]. Transactions of China Pulp and Paper, 2013, 28(1): 48-52. [百度学术]
高乐乐, 周强, 王伟刚. 基于CNN的深层次特征提取纸病辨识方法研究[J]. 中国造纸学报, 2019, 34(4): 52-58. [百度学术]
GAO L L, ZHOU Q, WANG W G. Paper Defects Recognition Based on Deep Layer Feature Extraction of CNN[J]. Transactions of China Pulp and Paper, 2019, 34(4): 52-58. [百度学术]
张开生, 关凯凯. 基于改进YOLOv5的纸病检测方法[J]. 中国造纸, 2022, 41(10): 79-86. [百度学术]
ZHANG K S, GUAN K K. Paper Defect Detection Method Based on Improved YOLOv5[J]. China Pulp & Paper, 2022, 41(10): 79-86. [百度学术]
戚玲珑, 高建瓴. 基于改进YOLOv7的小目标检测[J]. 计算机工程, 2023, 49(1): 41-48. [百度学术]
QI L L, GAO J L. Small Object Detection Based on Improved YOLOv7[J]. Computer Engineering, 2023, 49(1): 41-48. [百度学术]
WANG C, BOCHKOVSKIY A, LIAO H Y. YOLOv7: Trainable Bag-of-freebies Sets New State-of-the-art for Real-time Object Detectors[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023: 7464-7475. [百度学术]
韩雅洁, 郝晓丽, 牛保宁, 等. 小尺寸低对比度的传送带破损检测方法[J]. 太原理工大学学报, 2025, 56 (1): 148-156. [百度学术]
HAN Y J, HAO X L, NIU B N, et al. A Detection Method for Damage of Conveyor Belt with Small Size and Low Contrast[J]. Journal of Taiyuan University of Technology, 2025, 56 (1): 148-156. [百度学术]
李志诚, 曾志强. 基于改进YOLOv3的卷纸包装缺陷实时检测算法[J]. 中国造纸学报, 2022, 37(2): 87-93. [百度学术]
LI Z C, ZENG Z Q. A Real-time Detection Algorithm for Web Packaging Defects Based on Improved YOLOv3[J]. Transactions of China Pulp and Paper, 2022, 37(2): 87-93. [百度学术]
ZHENG Z H, WANG P, REN D W, et al. Enhancing Geometric Factors in Model Learning and Inference for Object Detection and Instance Segmenttion[J]. IEEE Transactions on Cybernetics, 2022, 52(8): 8574-8586. [百度学术]
ZHU X K, LYU S C, WANG X, et al. TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captured Scenarios[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision, 2021: 2778-2788. [百度学术]
YANG L, ZHANG R Y, LI L, et al. Simam: A Simple, Parameter-free Attention Module for Convolutional Neural Networks[C]//International Conference on Machine Learning. PMLR, 2021: 11863-11874. [百度学术]
WOO S, PARK J, LEE J Y, et al. Cbam: Convolutional Block Attention Module[C]//Proceedings of the European Conference on Computer Vision (ECCV), 2018: 3-19. [百度学术]