网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于梯度提升回归树算法的生活用纸皱纹等级软测量模型

  • 张冬启 1
  • 洪蒙纳 1
  • 李继庚 1
  • 满奕 1,2
1. 华南理工大学制浆造纸工程国家重点实验室,广东广州,510640; 2. 深圳新益昌科技股份有限公司,广东深圳,518000

中图分类号: TS736

最近更新:2020-06-29

DOI:10.11980/j.issn.0254-508X.2020.06.006

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
目录contents

摘要

皱纹等级是衡量生活用纸质量的重要指标之一。然而,工业生产过程中缺少皱纹等级的实时在线测量方法。为了解决上述问题,本研究通过实验对影响生活用纸皱纹质量的因素进行了分析。利用梯度提升回归树算法,对影响皱纹等级的表面粗糙度、皱纹深度、皱纹频率3个主要指标进行了建模,并通过预测这3个指标实现对皱纹等级的在线实时软测量。通过对比工业实测数据,发现该模型对表面粗糙度、皱纹深度、皱纹频率预测精度较高,测试数据的平均相对误差均小于5%。该模型解决了生活用纸皱纹等级在线软测量的问题,对生活用纸生产过程的质量控制提供了新的方法和依据。

我国生活用纸产量近10年的增长率达5.9%,是全国纸张总产量增长率的2倍以上。在所有的纸产品生产过程中,生活用纸具有最高的单位产品水耗和能[

1,2],如何提髙生活用纸能效水平和纸张质量是近年来造纸工作者面临的共同挑战。起皱是生活用纸生产中重要的环节,不仅影响纸机的能耗水平和后加工环节,还直接影响纸张的品质。研究表明,生活用纸经过起皱后,纵向伸长率可提高800%,纸张厚度增加300%,挺度下降38%,纸张强度下降70%。因此对起皱过程进行实时监[3]、定量化测量和表征皱纹质量、监测纸[4],在提高生活用纸质量和降低能耗方面有着重要作用。

为了对生活用纸皱纹质量进行科学表征,前人已经做了一些研究。在皱纹质量表征方面,Pan等[

5]测量了生活用纸皱纹深度、频率等指标,分析了这些指标对纸张伸长率和拉力的影响。在生活用纸皱纹质量影响因素方面,屈云海等[6]通过监测纸机的振动,及时发现故障,从而提高纸张皱纹质量。李广[7]通过实验,发现影响生活用纸皱纹质量的因素主要有纸张定量、浆料质量、起皱刮刀、起皱率等,进而提出了改善纸张皱纹质量的建议。管敏等[8]探究了皱纹质量与纸张柔软度之间的关系,研究了起皱刮刀的安装和使用对皱纹质量的影响。在制浆造纸建模方面,李远华等[9]利用机器学习等知识,建立了基于数据挖掘的抗张强度软测量模型。孟子薇等[10]建立了基于梯度提升回归树算法的打浆度软测量模型,并取得良好效果。Man等[11]通过机理建模,模拟造纸废水处理过程,结果表明,模型效果良好,能够准确得到出水COD含量。这些成果在一定程度上量化了影响生活用纸皱纹质量的影响因素,为起皱过程的优化提供了依据和参考。然而,影响皱纹等级的关键指标依然存在难以实时测量,存在大滞后或者测量仪器成本较高等缺陷。因此,在工业实践中,对皱纹等级的评定,往往依赖人工经验,这就导致了主观化判断和分类不准确的问题。

为解决生活用纸生产过程中皱纹等级的科学、快速、实时表征问题,本研究基于梯度提升回归树(GBRT)算法,在大量测量数据的基础上,建立皱纹等级软测量模型。为工业在线实时测量皱纹等级,提高纸张质量提供了科学依据。

1 技术路线和研究方法

为建立生活用纸皱纹等级软测量模型,本研究首先测量了生活用纸皱纹质量指标。之后通过相关性分析方法,选取了对皱纹等级影响大的几个指标作为输出结果。通过探究纸张生产中的各个环节对皱纹质量的影响,选择合适的输入变量;最后根据选择的变量,建立基于GBRT算法的生活用纸皱纹质量软测量模型。本研究的技术路线如图1所示,具体如下。

图1 生活用纸皱纹质量软测量技术路线图

(1)数据获取及预处理。通过企业数据库获取相应的制浆数据、造纸数据并测量皱纹质量数据。选择合适的皱纹质量指标作为皱纹质量软测量模型的输出,并对原始数据进行预处理,提高数据质量。

(2)特征选择。数据预处理后,通过单因素探究和相关性分析,选择对皱纹质量影响最大的因素,作为生活用纸皱纹质量软测量模型的输入。

(3)皱纹质量软测量模型的建立。由于GBRT具有精度高、收敛速度快等特点,故本研究以支持向量机(SVM)和AdaBoost为比对,建立基于GBRT算法生活用纸表面粗糙度、皱纹深度、皱纹频率软测量模型。3个软测量模型建立过程类似,后面将以表面粗糙度软测量模型建立为例,进行详细说明。

(4)模型评估及验证。计算误差,模型验证。

1.1 生活用纸皱纹质量及其测量

生活用纸皱纹质量分析仪是对生活用纸皱纹质量进行定量化的测量与分析的仪器,其基本测量项目包括表面粗糙度、皱纹深度、皱纹频率、皱纹宽度、细小皱纹、角度、独立峰脊数、针孔等15个指标。本研究采用的生活用纸皱纹质量分析仪由北京奥普乐科技开发有限公司生产。皱纹等级和质量指标及其物理含义如表1所示。

表1 皱纹等级和质量指标及其物理含义
指标范围含义对原纸影响
表面粗糙度/μm 11~30 微观形貌深度值均方值 手感平滑度
皱纹频率/个•cm-1 30~60 单位长度上宏观皱纹的个数 皱纹细腻程度
皱纹深度/μm 30~160 宏观皱纹峰-谷深度的平均值 皱纹深浅程度
皱纹等级 A/B/C 根据质量对产品分类 皱纹质量

本研究采用生活用纸皱纹质量分析仪结合现代光学与计算机图像处理,采用多光源光度学立体重构技术进行分析。在获取纸面的不同角度光源图像后,通过分析反光与阴影的变化规律来计算出纸面各部分对应的高度,从而得到纸张的三维信息。其中,皱纹频率、深度等参数,可以从三维高度图中通过傅里叶变换红外光谱仪得到,在温度和湿度相对稳定的条件下,连接好相关软件和仪器,取少量单层待测样品置于试样台上,即可进行测量。图2所示为生活用纸皱纹质量原图和3D合成图。

图2 生活用纸皱纹质量原图和3D合成图

皱纹等级可以通过皱纹指标得到。以某生活用纸企业定量为15.5 g/m2的纸种为例,使用生活用纸皱纹质量分析仪测量其标准纸样的皱纹指标,通过相关性分析得到。图3为标准纸样皱纹指标与皱纹等级的相关性。由图3可知,与皱纹等级相关性最大的指标分别是皱纹深度、表面粗糙度、皱纹频率。选取这3个指标对生活用纸皱纹等级进行定量化表征。图4为标准纸样皱纹深度、皱纹频率、表面粗糙度与皱纹等级的关系。

图3 标准纸样皱纹指标与皱纹等级的相关性

图4 皱纹深度、皱纹频率、表面粗糙度与皱纹等级的关系

图4可知,对于同一纸种而言,不同皱纹等级的皱纹指标存在一个明显的分层,皱纹等级越高,其表面粗糙度越低,皱纹深度越小,皱纹频率越大,皱纹越细腻。即可以使用粗糙度、皱纹深度和皱纹频率来定量化表征生活用纸的皱纹等级,进一步表明,通过这3个皱纹质量指标就可以得到皱纹等级。

1.2 相关性分析

在皱纹质量软测量模型建立之前,首先需要选择合适的变量作为软测量模型的输入。本研究使用Pearson相关系数进行分析,如式(1)所示。

r=Σ(xi-x¯)(yi-y¯)Σ(xi-x¯)2(yi-y¯)2 (1)

式中,xiyi分别代表2个变量的值;x¯y¯分别为2个变量的平均值;相关系数能够反映xy2个变量之间的相关性,通常在-1~1之间;r的绝对值越大,xy的相关程度越密切。

1.3 梯度提升回归树

梯度提升回归树(Gradient Boost Regression Tree, GBRT)模型是Boosting算法的一种,也是Boosting算法的一种改[

12]

GBRT模型的具体过程如下。

输入:训练数据集D=x1,y1, x2,y2,,xn,yn,损失函数L(y, fx)

输出:回归树fMx

步骤1:模型的初始化,如式(2)所示。

f0x=argmini=1mL(yi,ρ) (2)

式中,f0x是只有1个根节点的初始决策树,ρ为损失函数最小化常数,L(yi, ρ)为损失函[

13]

步骤2:迭代生成棵树。

(1)对于所有的样本N,计算损失函数的负梯度值,并将它作为残差的估计值rim,如式(3)所示。

rim=-Lyi,fm-1x1fm-1x1fx=fm-1x (3)

(2)针对上一步产生的残差生成一棵回归树gmx,将第m棵树的输入空间分割成J个不相交区域R1m, R2m,,Rjm,并计算梯度下降的步长,如式(4)所示。

ρm=arg minρ i=1mLyi,fm-1xi+ρgmxi (4)

利用线性搜索估计叶节点区域的值,使损失函数极小化。

步骤3:更新模型,其中Ir表示学习率,如式(5)所示。

fmx=fm-1x+Irρmgmxi (5)

步骤4:达到最大迭代次数,或者迭代停止条件时,输出回归树模型fx=fMx [

14],其中M表示树的数量。

1.4 对比模型

支持向量回归(SVR):SVR是支持向量机(SVM)的一个重要分支、其原理主要为寻找一个回归平面,使得所有样本数据到该平面的距离最近。SVR的性能和核函数的选择有很大关系,常用的核函数是高斯核(RBF[

15]。SVR能较好地解决有限样本学习问题,可避免局部最优解,但其精度受核函数的影响较大,这是由于采用不同的核函数,SVR将形成不同的方法所致。

AdaBoost:该算法的基本思想是将大量拟合能力一般的弱学习器通过一定方法叠加起来,构成一个具有很强拟合能力的学习器。理论证明,只要每个弱学习器的拟合能力比随机猜测的好,那么当弱学习器的个数趋向于无穷时,强学习器的错误率趋于[

16]。可对损失函数进行极小化优化。与其他算法相比,AdaBoost算法具有精度高、鲁棒性好等特点,但是其收敛速度较慢,有噪声时,容易过拟合。

2 模型建立

2.1 原始数据获取及预处理

本研究的数据来源于国内某大型生活用纸厂某生产线2019年4-5月的工艺数据和皱纹质量数据,共计380组。该生产线定量为11 g/m2、13.8 g/m2和15.5 g/m2等8个纸种,不同的纸种在浆料配比、磨浆工艺和造纸工艺等方面有所不同。因而,获取原始数据时,在保证生活用纸皱纹质量的情况下,每个纸种在起皱率、化学试剂用量、刮刀使用时间等工况方面,都设置了一定的梯度,确保涵盖95%以上的工况。其中,制浆工艺数据和造纸工艺数据从该企业的历史数据库中获[

17],皱纹质量数据由生活用纸皱纹质量分析仪测量得到。

数据预处理主要包括磨前纤维形态的计算和制浆、造纸、皱纹数据的匹配。根据浆料配比和不同浆板的原始纤维形态,计算混合后浆料的纤维形[

10]。然后通过测量生活用纸的皱纹质量,得到生活用纸的表面粗糙度、皱纹深度、皱纹频率等皱纹指标,并且通过数据库系统采集造纸过程中的车速、卷速、烘缸压力、烘缸温度等造纸过程数据,在此过程中,数据库通过记录该批次纸张的轴号,按照轴号将皱纹质量数据和造纸过程工艺数据进行匹配。

2.2 特征选择

为选取合适的变量作为生活用纸皱纹质量软测量模型的输入,本研究采取相关性分析和单因素探究。得到皱纹数据和工艺数据之后,使用相关性分析,探究工艺条件对皱纹质量的影响。以粗糙度为例,造纸过程工艺数据与纸张表面粗糙度的相关性如图5所示。

图5 造纸过程工艺与纸张表面粗糙度的相关性

图5可知,对生活用纸表面粗糙度影响较大的几个因素分别为:刮刀使用时间、加热后温度、卷曲率、烘缸压力等,其中,刮刀使用时间与表面粗糙度的相关性最高,对表面粗糙度的影响最大。

为了确保输入特征的准确性,根据相关性分析的结果和相关文献研[

5],本研究分别选取了与皱纹质量相关性大且容易控制的刮刀使用时间、起皱率等6个变量来做单因素探究。在其他情况不变的情况下,分别探究这6个因素对皱纹质量的影响。以刮刀使用时间和起皱率为例,图6图7分别为刮刀使用时间和起皱率对纸张表面粗糙度的影响。

图6 刮刀使用时间对纸张表面粗糙度的影响

图7 起皱率对纸张表面粗糙度的影响

图6可知,刮刀使用时间对纸张表面粗糙度影响很大,随着刮刀使用时间的增加,纸张表面粗糙度增加,且刮刀使用时间对纸张表面粗糙度的影响是分阶段的。前20 h纸张表面粗糙度显著增大,20~60 h纸张表面粗糙度变化不大,60 h后纸张表面粗糙度进一步增加,皱纹质量下降。当超过接受范围时,需要更换刮刀以保证皱纹质量。

图7可知,在其他条件相同时,随着起皱率的增加,纸张表面粗糙度上升且接近线性变化,即随着起皱率的增加,纸张皱纹质量变差。因此,想要得到高质量的皱纹,起皱率需控制在一定的范围之内。

综上可知,起皱率、刮刀使用时间等因素对生活用纸皱纹质量的影响很大,这与相关性分析的结果是一致的。为了防止过拟合,选取刮刀使用时间、加热后温度、起皱率、车速、卷速、纤维宽度、细小纤维百分比、长纤比等10个变量作为模型的输入,构建生活用纸皱纹质量软测量模型。

2.3 皱纹质量软测量模型的建立与评估

本研究选取GBRT算法,以支持向量机(SVM)和AdaBoost作为对比。每种算法都需要调节相应的参数,本研究选择网格搜索的方法进行参数调节,即对各个参数可能的取值进行排列组合,遍历各个参数的排列组合进行模型优化。为了减小样本分配带来的误差,防止过拟合,通过5折交叉验证的方式对模型进行评分,平均评分最高的参数组合为模型的最优参数。

选择均方误差(Mean Squared Error, MSE)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error, MRE)以及均方根误差(Root Mean Squared Error, RMSE[

18]作为模型的评价指标,在这4个指标中,数值越小表示误差模型的误差越小,模型效果越好。计算公式见式(6)~式(9)

MSE=1Ni=1Nyi-ŷi2 (6)
MAE=1Ni=1Nyi-ŷi        (7)
MRE=1NX=1Nyi-ŷiyi (8)
RMSE=1Ni=1Nyi-ŷi2 (9)

式中,yi是实际值,ŷi是预测值,N是验证样本数量。

以纸张表面粗糙度为例,调节好参数之后,随机选取80%数据作为训练集,20%数据作为测试集,3个模型的拟合情况如图8所示。由图8可见,在3个模型中,GBRT和AdaBoost效果良好,预测结果的变化趋势与实际值基本相同。其中,基于GBRT的表面粗糙度软测量模型的误差分布如图9所示,由图9可知,模型效果良好,其绝对误差均在1.6以内,其误差主要来自于某些工况突变。3个模型的评价结果如表2所示。

图8 3种模型软测量表面粗糙度结果与实际值对比

图9 基于GBRT的表面粗糙度软测量模型误差分布

表2 基于3个算法的表面粗糙度软测量模型结果
算法MAEMSERMSEMRE/%
RBF SVR 1.041 2.764 1.663 9.93
GBRT 0.629 0.64 0.80 3.44
AdaBoost 0.7 0.759 0.868 3.88

表2可知,在这3个模型中,GBRT和AdaBoost的RMSE分别为0.800、0.868,其MRE分别为3.44%、3.88%,模型拟合效果良好,平均相对误差小,能够准确地软测量得到生活用纸的表面粗糙度。在保证模型没有过拟合的情况下,模型精度越高越好,在误差允许的范围内,也可以考虑使用其他模型。

由于皱纹深度和皱纹频率的软测量模型建立过程与表面粗糙度软测量模型建立过程类似,在此不详细介绍。表3为基于GBRT算法的皱纹深度和皱纹频率软测量模型评估结果。由表3可知,基于GBRT算法的皱纹深度和皱纹频率软测量模型的MRE分别为3.64%和4.16%,模型效果良好,能够准确软测量得到生活用纸的皱纹质量。因此该模型可广泛应用于生活用纸企业。

表3 基于GBRT算法皱纹深度和皱纹频率软测量模型结果
指标MAEMSERMSEMRE/%
皱纹深度 1.774 5.349 2.313 3.64
皱纹频率 2.246 8.376 2.894 4.16

3 结 论

本研究建立了基于梯度提升回归树(GBRT)算法的生活用纸皱纹等级软测量模型,解决了生活用纸皱纹质量等级在线软测量的问题。分别建立生活用纸的表面粗糙度、皱纹深度、皱纹频率软测量模型,基于GBRT算法3个模型的平均相对误差分别为3.44%、3.64%、4.16%,模型效果良好。该模型能够准确软测量生活用纸的皱纹质量,对实时监测生活用纸皱纹质量、精细控制起皱过程具有重要意义。

参考文献

1

Man Y, Han Y L, Wang Y F, et al. Woods to goods: Water consumption analysis for papermaking industry in China [J]. Journal of Cleaner Production, 2018, 195: 1377. [百度学术

2

Man Y, Han Y L, Li J G, et al. Life cycle energy consumption analysis and green manufacture evolution for papermaking industry in China [J]. Green Chemistry, 2019, 21(5): 1011. [百度学术

3

汪 涵李继庚满 奕. 生活用纸质量监控与异常分析方法的研究 [J]. 中国造纸2017, 36(11): 50. [百度学术

WANG Han, LI Jigeng, MAM Yi , et al. Study on Quality Monitoring and Abnormal Analysis Method for Tissue Paper [J]. China Pulp&Paper, 2017, 36(11): 50. [百度学术

4

殷燕屏熊智新胡慕伊. 基于阈值分割及分形特征的纸病图像识别算法研究 [J]. 中国造纸学报2011, 26(4): 41. [百度学术

YIN Yanping, XIONG Zhixin, HU Muyi. Identification Algorithm of Paper Defects Based on Threshold Segmentation and Fractal Characteristics [J]. Transactions of China Pulp and Paper, 2011, 26(4): 41. [百度学术

5

Pan K, Phani A S, Green S. Particle dynamics modeling of the creping process in tissue making [J]. Journal of Manufacturing Science and Engineering, 2018, 140(7): 1. [百度学术

6

屈云海张 辉. 振动监测与现代造纸机械故障诊断技术的发展 [J]. 中国造纸学报2013, 28(1): 56. [百度学术

QU Yunhai, ZHANG Hui. Technological Progress in Vibration Monitoring and Mechanical Fault Diagnosis for Modern Papermaking Machinery [J]. Transactions of China Pulp and Paper, 2013, 28(1): 56. [百度学术

7

李广森. 影响卫生纸起皱的因素及其解决方法[J].生活用纸, 2010(24): 24. [百度学术

Li Guangsen. Factors affecting creping of tissue paper and its solution [J]. Tissue Paper & Disposable Product, 2010(24): 24. [百度学术

8

管 敏李晨曦刘洪斌. 影响生活用纸柔软度主要因素的研究进展 [J]. 中国造纸2018, 37(2): 58. [百度学术

GUAN Min, LI Chenxi, LIU Hongbin, et al. Review on the Key Factors Affecting Softness of Tissue Paper [J]. China Pulp & Paper, 2018, 37(2): 58. [百度学术

9

李远华刘焕彬陶劲松. 纸张抗张强度模型的研究进展 [J]. 中国造纸2014, 33(1): 65. [百度学术

LI Yuanhua, LIU Huanbin, TAO Jinsong, et al. Research Progress on Tensile Strength Model of Paper [J]. China Pulp & Paper, 2014, 33(1): 65. [百度学术

10

孟子薇洪蒙纳李继庚. 基于梯度增强回归树算法的磨浆过程打浆度软测量模型 [J]. 造纸科学与技术, 2019, 38(1): 83. [百度学术

Meng Ziwei, Hong Mengna, Li Jigeng, et al. Gradient boosting regression trees algorithm based forecasting model for beating degree of the pulping process [J]. Paper Science and Technology, 2019, 38(1): 83. [百度学术

11

Man Y, Shen W H, Chen X Q, et al. Modeling and simulation of the industrial sequencing batch reactor wastewater treatment process for cleaner production in pulp and paper mills [J]. Journal of Cleaner Production, 2017, 167: 643. [百度学术

12

Friedman J H. Stochastic gradient boosting [J]. Computational Statistics & Data Analysis, 2002, 38(4): 367. [百度学术

13

李 根. 基于梯度提升决策树的高速公路交织区汇入模型 [J]. 东南大学学报2018, 48(3): 187. [百度学术

Li Gen. Merging model in freeway weaving section based on gradient boosting decision tree [J]. Journal of Southeast University, 2018, 48(3): 187. [百度学术

14

龚 越罗小芹王殿海. 基于梯度提升回归树的城市道路行程时间预测 [J]. 浙江大学学报2018, 52(3): 453. [百度学术

Gong Yue, Luo Xiaoqin, Wang Dianhai, et al. Urban travel time prediction based on gradient boosting regression trees [J]. Journal of Zhejiang University, 2018, 52(3): 453. [百度学术

15

周 鑫. 基于GBRT的交通流量预测算法研究 [J]. 现代计算机2019, 643(7): 40. [百度学术

Zhou Xin. Research on the traffic flow forecasting algorithm based on GBRT [J]. Modern Computer, 2019, 643(7): 40. [百度学术

16

阮锦新尹俊勋. 基于人脸特征和AdaBoost算法的多姿态人脸检测 [J]. 计算机应用2010, 30(4): 967. [百度学术

Ruan Jinxin, Yin Junxun. Multi-pose face based on facial features and AdaBoost algorithm [J]. Journal of Computer Applications, 2010, 30(4): 967. [百度学术

17

陈晓彬李继庚. 工业4.0时代下智能造纸工业的构建及其关键技术 [J]. 中国造纸2016, 35(3): 55. [百度学术

CHEN Xiaobin, LI Jigeng. Research on the Construction and Key Technologies of Intelligent Pulp and Paper Industry [J]. China Pulp & Paper, 2016, 35(3): 55 [百度学术

18

沈夏炯张俊涛韩道军. 基于梯度提升回归树的短时交通流预测模型 [J]. 计算机科学2018, 45(6): 228. [百度学术

Shen Xiajiong, Zhang Juntao, Han Daojun. Short term traffic model based on gradient boosting regression tree [J]. Computer Science, 2018, 45(6): 228. [百度学术

CPP [百度学术