摘要
皱纹等级是衡量生活用纸质量的重要指标之一。然而,工业生产过程中缺少皱纹等级的实时在线测量方法。为了解决上述问题,本研究通过实验对影响生活用纸皱纹质量的因素进行了分析。利用梯度提升回归树算法,对影响皱纹等级的表面粗糙度、皱纹深度、皱纹频率3个主要指标进行了建模,并通过预测这3个指标实现对皱纹等级的在线实时软测量。通过对比工业实测数据,发现该模型对表面粗糙度、皱纹深度、皱纹频率预测精度较高,测试数据的平均相对误差均小于5%。该模型解决了生活用纸皱纹等级在线软测量的问题,对生活用纸生产过程的质量控制提供了新的方法和依据。
我国生活用纸产量近10年的增长率达5.9%,是全国纸张总产量增长率的2倍以上。在所有的纸产品生产过程中,生活用纸具有最高的单位产品水耗和能
为了对生活用纸皱纹质量进行科学表征,前人已经做了一些研究。在皱纹质量表征方面,Pan等
为解决生活用纸生产过程中皱纹等级的科学、快速、实时表征问题,本研究基于梯度提升回归树(GBRT)算法,在大量测量数据的基础上,建立皱纹等级软测量模型。为工业在线实时测量皱纹等级,提高纸张质量提供了科学依据。
为建立生活用纸皱纹等级软测量模型,本研究首先测量了生活用纸皱纹质量指标。之后通过相关性分析方法,选取了对皱纹等级影响大的几个指标作为输出结果。通过探究纸张生产中的各个环节对皱纹质量的影响,选择合适的输入变量;最后根据选择的变量,建立基于GBRT算法的生活用纸皱纹质量软测量模型。本研究的技术路线如

图1 生活用纸皱纹质量软测量技术路线图
(1)数据获取及预处理。通过企业数据库获取相应的制浆数据、造纸数据并测量皱纹质量数据。选择合适的皱纹质量指标作为皱纹质量软测量模型的输出,并对原始数据进行预处理,提高数据质量。
(2)特征选择。数据预处理后,通过单因素探究和相关性分析,选择对皱纹质量影响最大的因素,作为生活用纸皱纹质量软测量模型的输入。
(3)皱纹质量软测量模型的建立。由于GBRT具有精度高、收敛速度快等特点,故本研究以支持向量机(SVM)和AdaBoost为比对,建立基于GBRT算法生活用纸表面粗糙度、皱纹深度、皱纹频率软测量模型。3个软测量模型建立过程类似,后面将以表面粗糙度软测量模型建立为例,进行详细说明。
(4)模型评估及验证。计算误差,模型验证。
生活用纸皱纹质量分析仪是对生活用纸皱纹质量进行定量化的测量与分析的仪器,其基本测量项目包括表面粗糙度、皱纹深度、皱纹频率、皱纹宽度、细小皱纹、角度、独立峰脊数、针孔等15个指标。本研究采用的生活用纸皱纹质量分析仪由北京奥普乐科技开发有限公司生产。皱纹等级和质量指标及其物理含义如
本研究采用生活用纸皱纹质量分析仪结合现代光学与计算机图像处理,采用多光源光度学立体重构技术进行分析。在获取纸面的不同角度光源图像后,通过分析反光与阴影的变化规律来计算出纸面各部分对应的高度,从而得到纸张的三维信息。其中,皱纹频率、深度等参数,可以从三维高度图中通过傅里叶变换红外光谱仪得到,在温度和湿度相对稳定的条件下,连接好相关软件和仪器,取少量单层待测样品置于试样台上,即可进行测量。


图2 生活用纸皱纹质量原图和3D合成图
皱纹等级可以通过皱纹指标得到。以某生活用纸企业定量为15.5 g/

图3 标准纸样皱纹指标与皱纹等级的相关性

图4 皱纹深度、皱纹频率、表面粗糙度与皱纹等级的关系
由
在皱纹质量软测量模型建立之前,首先需要选择合适的变量作为软测量模型的输入。本研究使用Pearson相关系数进行分析,如
(1) |
式中,、分别代表2个变量的值;、分别为2个变量的平均值;相关系数能够反映x与y2个变量之间的相关性,通常在-1~1之间;r的绝对值越大,x与y的相关程度越密切。
梯度提升回归树(Gradient Boost Regression Tree, GBRT)模型是Boosting算法的一种,也是Boosting算法的一种改
GBRT模型的具体过程如下。
输入:训练数据集 ,损失函数。
输出:回归树。
步骤1:模型的初始化,如
(2) |
式中,是只有1个根节点的初始决策树,为损失函数最小化常数,为损失函
步骤2:迭代生成M棵树。
(1)对于所有的样本N,计算损失函数的负梯度值,并将它作为残差的估计值,如
(3) |
(2)针对上一步产生的残差生成一棵回归树,将第m棵树的输入空间分割成J个不相交区域 ,并计算梯度下降的步长,如
(4) |
利用线性搜索估计叶节点区域的值,使损失函数极小化。
步骤3:更新模型,其中表示学习率,如
(5) |
步骤4:达到最大迭代次数,或者迭代停止条件时,输出回归树模型[
支持向量回归(SVR):SVR是支持向量机(SVM)的一个重要分支、其原理主要为寻找一个回归平面,使得所有样本数据到该平面的距离最近。SVR的性能和核函数的选择有很大关系,常用的核函数是高斯核(RBF
AdaBoost:该算法的基本思想是将大量拟合能力一般的弱学习器通过一定方法叠加起来,构成一个具有很强拟合能力的学习器。理论证明,只要每个弱学习器的拟合能力比随机猜测的好,那么当弱学习器的个数趋向于无穷时,强学习器的错误率趋于
本研究的数据来源于国内某大型生活用纸厂某生产线2019年4-5月的工艺数据和皱纹质量数据,共计380组。该生产线定量为11 g/
数据预处理主要包括磨前纤维形态的计算和制浆、造纸、皱纹数据的匹配。根据浆料配比和不同浆板的原始纤维形态,计算混合后浆料的纤维形
为选取合适的变量作为生活用纸皱纹质量软测量模型的输入,本研究采取相关性分析和单因素探究。得到皱纹数据和工艺数据之后,使用相关性分析,探究工艺条件对皱纹质量的影响。以粗糙度为例,造纸过程工艺数据与纸张表面粗糙度的相关性如

图5 造纸过程工艺与纸张表面粗糙度的相关性
由
为了确保输入特征的准确性,根据相关性分析的结果和相关文献研

图6 刮刀使用时间对纸张表面粗糙度的影响

图7 起皱率对纸张表面粗糙度的影响
由
由
综上可知,起皱率、刮刀使用时间等因素对生活用纸皱纹质量的影响很大,这与相关性分析的结果是一致的。为了防止过拟合,选取刮刀使用时间、加热后温度、起皱率、车速、卷速、纤维宽度、细小纤维百分比、长纤比等10个变量作为模型的输入,构建生活用纸皱纹质量软测量模型。
本研究选取GBRT算法,以支持向量机(SVM)和AdaBoost作为对比。每种算法都需要调节相应的参数,本研究选择网格搜索的方法进行参数调节,即对各个参数可能的取值进行排列组合,遍历各个参数的排列组合进行模型优化。为了减小样本分配带来的误差,防止过拟合,通过5折交叉验证的方式对模型进行评分,平均评分最高的参数组合为模型的最优参数。
选择均方误差(Mean Squared Error, MSE)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error, MRE)以及均方根误差(Root Mean Squared Error, RMSE
(6) |
(7) |
(8) |
(9) |
式中,是实际值,是预测值,N是验证样本数量。
以纸张表面粗糙度为例,调节好参数之后,随机选取80%数据作为训练集,20%数据作为测试集,3个模型的拟合情况如

图8 3种模型软测量表面粗糙度结果与实际值对比

图9 基于GBRT的表面粗糙度软测量模型误差分布
由
由于皱纹深度和皱纹频率的软测量模型建立过程与表面粗糙度软测量模型建立过程类似,在此不详细介绍。
本研究建立了基于梯度提升回归树(GBRT)算法的生活用纸皱纹等级软测量模型,解决了生活用纸皱纹质量等级在线软测量的问题。分别建立生活用纸的表面粗糙度、皱纹深度、皱纹频率软测量模型,基于GBRT算法3个模型的平均相对误差分别为3.44%、3.64%、4.16%,模型效果良好。该模型能够准确软测量生活用纸的皱纹质量,对实时监测生活用纸皱纹质量、精细控制起皱过程具有重要意义。
参考文献
Man Y, Han Y L, Wang Y F, et al. Woods to goods: Water consumption analysis for papermaking industry in China [J]. Journal of Cleaner Production, 2018, 195: 1377. [百度学术]
Man Y, Han Y L, Li J G, et al. Life cycle energy consumption analysis and green manufacture evolution for papermaking industry in China [J]. Green Chemistry, 2019, 21(5): 1011. [百度学术]
汪 涵,李继庚,满 奕,等. 生活用纸质量监控与异常分析方法的研究 [J]. 中国造纸,2017, 36(11): 50. [百度学术]
WANG Han, LI Jigeng, MAM Yi , et al. Study on Quality Monitoring and Abnormal Analysis Method for Tissue Paper [J]. China Pulp&Paper, 2017, 36(11): 50. [百度学术]
殷燕屏,熊智新,胡慕伊. 基于阈值分割及分形特征的纸病图像识别算法研究 [J]. 中国造纸学报,2011, 26(4): 41. [百度学术]
YIN Yanping, XIONG Zhixin, HU Muyi. Identification Algorithm of Paper Defects Based on Threshold Segmentation and Fractal Characteristics [J]. Transactions of China Pulp and Paper, 2011, 26(4): 41. [百度学术]
Pan K, Phani A S, Green S. Particle dynamics modeling of the creping process in tissue making [J]. Journal of Manufacturing Science and Engineering, 2018, 140(7): 1. [百度学术]
屈云海,张 辉. 振动监测与现代造纸机械故障诊断技术的发展 [J]. 中国造纸学报,2013, 28(1): 56. [百度学术]
QU Yunhai, ZHANG Hui. Technological Progress in Vibration Monitoring and Mechanical Fault Diagnosis for Modern Papermaking Machinery [J]. Transactions of China Pulp and Paper, 2013, 28(1): 56. [百度学术]
李广森. 影响卫生纸起皱的因素及其解决方法[J].生活用纸, 2010(24): 24. [百度学术]
Li Guangsen. Factors affecting creping of tissue paper and its solution [J]. Tissue Paper & Disposable Product, 2010(24): 24. [百度学术]
管 敏,李晨曦,刘洪斌,等. 影响生活用纸柔软度主要因素的研究进展 [J]. 中国造纸,2018, 37(2): 58. [百度学术]
GUAN Min, LI Chenxi, LIU Hongbin, et al. Review on the Key Factors Affecting Softness of Tissue Paper [J]. China Pulp & Paper, 2018, 37(2): 58. [百度学术]
李远华,刘焕彬,陶劲松,等. 纸张抗张强度模型的研究进展 [J]. 中国造纸,2014, 33(1): 65. [百度学术]
LI Yuanhua, LIU Huanbin, TAO Jinsong, et al. Research Progress on Tensile Strength Model of Paper [J]. China Pulp & Paper, 2014, 33(1): 65. [百度学术]
孟子薇,洪蒙纳,李继庚,等. 基于梯度增强回归树算法的磨浆过程打浆度软测量模型 [J]. 造纸科学与技术, 2019, 38(1): 83. [百度学术]
Meng Ziwei, Hong Mengna, Li Jigeng, et al. Gradient boosting regression trees algorithm based forecasting model for beating degree of the pulping process [J]. Paper Science and Technology, 2019, 38(1): 83. [百度学术]
Man Y, Shen W H, Chen X Q, et al. Modeling and simulation of the industrial sequencing batch reactor wastewater treatment process for cleaner production in pulp and paper mills [J]. Journal of Cleaner Production, 2017, 167: 643. [百度学术]
Friedman J H. Stochastic gradient boosting [J]. Computational Statistics & Data Analysis, 2002, 38(4): 367. [百度学术]
李 根. 基于梯度提升决策树的高速公路交织区汇入模型 [J]. 东南大学学报,2018, 48(3): 187. [百度学术]
Li Gen. Merging model in freeway weaving section based on gradient boosting decision tree [J]. Journal of Southeast University, 2018, 48(3): 187. [百度学术]
龚 越,罗小芹,王殿海,等. 基于梯度提升回归树的城市道路行程时间预测 [J]. 浙江大学学报,2018, 52(3): 453. [百度学术]
Gong Yue, Luo Xiaoqin, Wang Dianhai, et al. Urban travel time prediction based on gradient boosting regression trees [J]. Journal of Zhejiang University, 2018, 52(3): 453. [百度学术]
周 鑫. 基于GBRT的交通流量预测算法研究 [J]. 现代计算机,2019, 643(7): 40. [百度学术]
Zhou Xin. Research on the traffic flow forecasting algorithm based on GBRT [J]. Modern Computer, 2019, 643(7): 40. [百度学术]
阮锦新,尹俊勋. 基于人脸特征和AdaBoost算法的多姿态人脸检测 [J]. 计算机应用,2010, 30(4): 967. [百度学术]
Ruan Jinxin, Yin Junxun. Multi-pose face based on facial features and AdaBoost algorithm [J]. Journal of Computer Applications, 2010, 30(4): 967. [百度学术]