网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于主成分分析法对一次性纸杯的拉曼光谱检验研究

  • 朱晓晗 1
  • 胡越宁 1
  • 何歆沂 1
  • 黄国玺 1
  • 姜红 1
  • 陈敏璠 2
1. 中国人民公安大学,北京,100038; 2. 北京鉴知技术有限公司,北京,100084

中图分类号: TS767

最近更新:2020-09-27

DOI:10.11980/j.issn.0254-508X.2020.09.007

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
目录contents

摘要

为建立一种检验犯罪现场遗留一次性纸杯物证的科学有效的方法,利用拉曼光谱结合化学计量学对收集到的27个不同品牌、不同用途的一次性纸杯样本的拉曼特征峰峰位和峰强度的对比,对一次性纸杯样本进行区分。为了使分类结果科学准确,利用化学计量学的方法对光谱数据进行分析处理。为了减少聚类分析所用的变量个数,利用主成分分析法对拉曼光谱数据进行降维处理,指定提取3个因子,减少变量个数,保留大部分信息,其累计贡献率达99.09%。利用层次聚类和K-Means快速聚类将27个样本分为8类,并利用Fisher判别分析法验证了分类结果的科学合理性,从而对未知样本的类别判断提供依据。

作为许多家庭和公共场所中常用的饮水工具,一次性纸杯在各类案件现场都有可能会被提取到,为了使公安机关明确此类物证的侦破方向,通过对一次性纸杯进行拉曼光谱(RAMAN)检验和化学计量分析,根据各个纸杯的拉曼特征峰进而推测一次性纸杯的品牌、来源等相关信息。常见的一次性纸杯内壁主要淋膜食品级聚乙烯(PE)薄膜,用来隔水等用[

1-2]。生产厂家在一次性纸杯生产过程中,为了降低生产成本,满足盛装热水、冷水等不同需求,不同品牌、不同用途的一次性纸杯所使用的原料种类与配比存在差异,这就为一次性纸杯的拉曼光谱检验区分提供可能。

为了使拉曼光谱检验一次性纸杯实验的分类结果更加科学合理,对样本拉曼光谱数据进行降维处理,选择主成分分析法,保留了一次性纸杯拉曼光谱数据的大部分信息。本研究以主成分分析法指定提取的因子作为变量进行层次聚类和K-Means快速聚类,对27个不同品牌、不通用途的一次性纸杯进行分类,利用Fisher判别分析法、聚类方法之间相互验证,在得到最佳聚类数的同时可直观看出样本各类别的类中心在判别分析图中的位置关系,实现对未知样本的类别判断,进而判断未知样本的品牌、来源等信息,该方法可为公安机关检验此类物证提供借[

3-5]

1 实 验

1.1 实验仪器及条件

RT2000便捷式拉曼光谱仪(北京鉴知技术有限公司),实验条件见表1

表1 拉曼光谱实验条件
参数参数标准
激光光源 785 nm
激光功率 50 mW
积分时间 5000 ms
光谱采集范围 3500~200 cm-1
电压 220 V
采集方式 点扫描

1.2 实验样本

不同品牌不同用途的一次性纸杯样本27个(见表2),分别编号为1#~27#

表2 一次性纸杯样本表
样本编号样本名称及来源纸杯高度/cm杯口直径/cm
1# 公安大学二食堂原磨豆浆杯 11.1 8.8
2# 北京好利来牛奶杯 10.7 8.5
3# 北京永和大王现磨豆浆杯 10.2 8.6
4# 北京肯德基热饮小杯 9.3 8.0
5# 北京西贝莜面村纸杯 9.3 8.0
6# 北京肯德基冷饮小杯 9.7 7.4
7# 北京味多美咖啡杯 8.7 7.5
8# 北京锦江之星纸杯 8.5 7.4
9# 公安大学二食堂三楼纸杯 8.5 7.4
10# “妙潔”纸杯(北京) 8.8 7.2
11# “清清美”纸杯(广西) 8.7 7.4
12# 北京鑫隆纸杯 8.5 7.4
13# 公安大学东配楼休息室纸杯 8.5 7.4
14# 北京同仁科技纸杯 8.5 7.5
15# 白色纸杯 8.5 7.4
16# 北京唐拉雅秀酒店纸杯 8.7 7.5
17# 北京速8酒店纸杯 8.7 7.5
18# 和路雪奶昔杯 9.6 7.6
19# 南宁客运段纸杯 8.3 7.5
20# “妙潔”纸杯(广西) 8.6 7.0
21# 北京咉暒纸杯 5.2 8.6
22# “八喜”纸杯(北京) 5.4 8.6
23# 鲜榨椰子粉(青柠味)纸杯 16.5 8.9
24# 苏伯菠菜蛋花汤纸杯 9.0 9.3
25# 北京肯德基大杯纸杯 16.5 9.1
26# 福昔甜品纸杯 13.0 8.9
27# “妙潔”纸杯(北京) 8.0 7.3

1.3 拉曼光谱分析

拉曼光谱(RAMAN)作为一种散射光谱,通过与入射光频率不同的散射光谱进行分析,进而得到所测样本分子振动、转动方面信息,并应用于分子结构研究的一种快速无损简便的分析方[

6-7]。本实验利用拉曼光谱法检测一次性纸杯样本内壁上的平整部分,用指定拉曼光谱检测仪对此处进行数据采集,记录样本检测数据与拉曼光谱图。

1.4 因子分析数学模型

因子分析的核心是用较少的互相独立的因子反映原有变量的绝大部分信息。本研究使用因子分析中的主成分分析法对拉曼光谱数据进行降维处理,将大量变量减少为3个变量。设有k个原有变量x1x2x3,…,xk,且每个变量(经标准化处理后)的均值均为0,标准差为1。现将每个原有变量用hhk)个因子f1f2f3,…,fh(标准化值)的线性组合来表示,见式(1)

x1=a11f1+a12f2++a1kfh+ε1x2=a21f1+a22f2++a2kfh+ε2xh=ah1f1+ah2f2++ahkfh+εh (1)

式(1)为因子分析的数学模型,也可以用矩阵的形式表示见式(2)

X=AF+ε (2)

式中,F为因子,由于出现在每个原有变量的线性表达式中,因此又称公共因子,fjj=1,2,…,k)彼此不相关;A称为因子载荷矩阵;aiji=1,2,…,pj=1,2,…,k)称为载荷因子,是第i个原有变量在第j个因子上的载荷;ε称为特殊因子,表示原有变量不能被因子解释的部分,其均值为0,独立于fjj=1,2,…,k)。

1.5 层次聚类

SPSS数据处理软件在层次聚类分析中,需要计算的是个体间的“亲疏程度”,根据个体间相似度和差异性对其进行测量。实验中使用平方欧式距离(SEUCLID)作为层次聚类计算方式,其数学表达式见式(3)

SEUCLID(x,y)=i=1p(xi-yi)2 (3)

式中,xi是个体x的第i个变量的变量值;yi是个体y的第i个变量的变量值。

1.6 K-Means聚类分析

K-Means聚类分析是将数据看成p维空间上的点,以距离作为测度个体“亲疏程度”的指标,并以牺牲多个解为代价换得高执行效率。首先,指定聚类数目K,再确定K个初始类中心点,根据距离最近原则进行分类,接着重新确定K个类中心点,并判断是否已经满足终止聚类的条件,如满足,则终止聚[

8-10]

2 结果与讨论

2.1 拉曼光谱分析

根据27个一次性纸杯拉曼谱图(见图1)发现,27个纸杯样本均在1059、1125、1288和1429 cm-1处出现特征峰,经分析,该特征峰与聚乙烯(PE)的特征峰分别对应,可确定所检验一次性纸杯淋膜的主要成分为PE[

11-12]。由于不同品牌不同用途一次性纸杯的拉曼谱图中特征峰的峰位置和峰强度存在差异,因此可以对其进行区分。如“妙潔”纸杯样本在1380 cm-1和1439 cm-1处有特征峰,而“清清美”纸杯样本没有,因此可以将二者分开。

图1 27个一次性纸杯样本拉曼谱图比较

2.2 拉曼数据主成分分析

在进行拉曼光谱分析时,由于拉曼数据信息量庞大,存在信息重叠等问题,使得分析结果出现偏差,因此常常使用降维手段对数据进行处理,减少数据维数。主成分分析是一种常见的降维方法,在保留原数据主要信息的前提下,将多变量问题处理成一组新的相互无关的少数综合变量的问题,可以有效降低多个变量之间的信息重叠,提高分析结果的准确度。

因子fj方差贡献的数学定义见式(4)

Sj2=i=1paij2 (4)

式(4)表明,因子fj的方差贡献是因子载荷矩阵A中第j列元素的平方和。因子fj的方差贡献反映了因子fj对原有变量总方差的解释能力。总方差解释见表3,该值越大说明相对应的因子越重要。

表3 总方差解释
因子方差贡献方差百分比/%累积/%
1 1681.91 84.10 84.10
2 269.46 13.47 97.57
3 30.42 1.52 99.09

k个因子的累计方差贡献率定义为式(5),其中,λj代表相关系数矩阵特征值,p代表原有p个变量的总方差。

ak=j=1kSj2p=j=1kλjj=1pλj (5)

表3中,因子1的方差贡献为1681.91,解释原有变量总方差的84.10%,累计方差贡献率为84.10%;其他数据含义类推。由表3可知,指定提取3个因子,3个因子共解释了原有变量的99.09%。总体上,原有变量的信息丢失较少,因子分析结果较理想。

2.3 基于SPSS分析软件的聚类分析

2.3.1 层次聚类和K-Means快速聚类

为了实现对样本的分类研究,确保分类结果的合理性,利用SPSS分析软件对主成分分析法降维后的样本数据进行层次聚类与K-Means快速聚类分析。利用层次聚类中的凝聚方式聚类,首先,每个观测个体自成一类,再按照某种方法度量所有个体间的“亲疏程度”,并将其中最“亲密”的个体聚成一小类,形成n-1个类,然后再次度量剩余观测个体和小类间的“亲疏程度”,并将当前最亲密的个体或小类再聚成一类,重复上述过程,不断将所有个体和小类聚集成越来越大的类,直至所有个体聚到一起,形成一个巨大的类为止。K-Means快速聚类是一个反复迭代的过程,在聚类过程中,观测所属的类不断调整,直至最终达到稳定为止。

层次聚类结果表明,在并类距离为1时,27个一次性纸杯样本被分为8类。K-Means聚类分析法证明了层次聚类结果的合理性。表4显示了K-Means聚类分析后,8类变量中心点每次迭代时的偏移情况。共经历3次迭代。第3次迭代后,8类中心点偏移量均小于指定的判别标准0.02,聚类结束。

表4 迭代历史记录
迭代聚类中心内的更改
12345678
1 0.31 0 0 0 0 0.44 0.34 0.29
2 0 0 0 0 0 0 0.11 0.14
3 0 0 0 0 0 0 0 0

表5显示了8类变量最终聚类中心点的情况。8个最终类中心点的数据分别为(-0.91,2.23,-1.65)(4.02,1.37,1.92)(-0.19,2.85,-0.59)(-1.21,

表5 K-Means算法最终聚类中心
因子聚类
12345678
1 -0.91 4.02 -0.19 -1.21 1.15 -0.39 0.29 -0.45
2 2.23 1.37 2.85 -1.02 0.39 -0.54 -0.17 -0.58
3 -1.65 1.92 -0.59 -1.99 1.19 -0.98 0.63 -0.03

-1.02,-1.99)(1.15,0.39,1.19)(-0.39,-0.54,-0.98)(0.29,-0.17,0.63)(-0.45,-0.58,-0.03),这些中心点的数据展示了每一类样本在因子1、2、3下的最终聚类中心。

2.3.2 Fisher判别分析

为了验证层次聚类和K-Means快速聚类的准确合理性,对数据进行Fisher判别分析,得到了8类样本在所建立的分类函数上的判别分析图。判别分析是一种经典的多元统计分析方法,用于对分类型变量取值的分析。Fisher判别分析是先投影再判别,投影是其核心。所谓投影,是将原来pX空间的观测点投影到mmp)维Y空间中(这里的Y空间称为Fisher判别空间)。图2为8类样本类中心在Fisher判别分析图中的位置分布情况。由图2可知,相比函数2判别轴,函数1判别轴对各类别的区分情况更加明显,如果想区分未知变量,只需要输入相应位置,在图中会显示出新数据的位置,就能区别新数据是哪一类别。8个类别中心很明显地彼此区别开且各类别观测点分布相对比较集中,从而验证了将27个样本分为8类较为准确合理。

图2 Fisher判别分析图

以上聚类分析方法将27个一次性纸杯样本分为8类,所有一次性纸杯样本的分类结果见表6。其中,第1类样本数量最大,样本普遍为源自北京的中等体积(高度8~9 cm,杯口直径7~8 cm)的热饮杯;第3类样本数量为7个,样本普遍为中等体积(高度8~9 cm,杯口直径7~8 cm)的纸杯;第4类样本为冷饮杯;第5类样本为统一高度9.3 cm、杯口直径8 cm的纸杯;第6类样本为较大体积(高度10.5 cm以上)的热饮杯。可见,每类样本的用途和大小不尽相同,据此,根据未知样本碎片的拉曼光谱检测结果可对其进行归类研究,进而推断未知样本的品源和来源信息。

表6 一次性纸杯分类结果
类别样本编号
第1类 7#9#、10#、16#、17#、18#、21#、23#、25#、26#、27#
第2类 15#
第3类 8#、11#、12#、14#、19#、22#、24#
第4类 6#、20#
第5类 4#5#
第6类 1#2#
第7类 3#
第8类 13#

3 结 论

本实验利用拉曼光谱仪结合化学计量学对27个不同品牌、不同用途的一次性纸杯样本进行检验研究。采用主成分分析和聚类方法对拉曼光谱数据进行处理,对纸杯进行聚类。

3.1 拉曼光谱结果表明,所得27个一次性纸杯样本拉曼光谱图中,样本均在1059、1125、1288和1429 cm-1处出现特征峰,表明样本内壁所测薄膜主要成分为聚乙烯(PE)。通过拉曼光谱特征峰峰位置和峰强度的不同,可以达到区分一次性纸杯检验的目的。

3.2 为减少进行聚类分析时所用变量,对拉曼光谱数据进行主成分分析,指定提取3个因子,累计贡献率达到99.09%,在减少变量的同时,保存了大量信息。

3.3 以指定提取的3个因子作为变量进行层次聚类和K-Means快速聚类分析,将27个纸杯样本聚成了8类,并对K-Means算法下8类变量最终聚类中心点位置进行描述。根据未知一次性纸杯样本碎片的拉曼光谱检测结果可对其进行归类研究,进而推断未知样本的品牌和来源等信息。

3.4 在Fisher判别分析中,将8类变量的类中心位置在判别分析图中进行描绘,8类变量的类中心可以很好地区分开且各类别观测点分布相对比较集中,证明了聚类结果的科学合理性。

参考文献

1

姜 红鞠晨阳黄国玺.拉曼光谱法检验一次性纸杯的研究[J].黑龙江造纸2018464):4. [百度学术

Jiang HongJu ChenyangHuang Guoxiet al. Study on the detection of disposable paper cup by Raman spectroscopy [J]. Heilongjiang Pulp and Paper2018464): 4. [百度学术

2

郭礼强刘 彭张轩恺.高效液相色谱法快速检测纸杯中甲醛残留[J].中国造纸学报2019342):38. [百度学术

GUO LiqiangLIU PengZHANG xuankaiet al. Rapid Determination of Formaldehyde Residue in Paper Cups by High Performance Liquid Chromatography [J]. Transactions of China Pulp and Paper2019342): 38 [百度学术

3

薛 薇.基于SPSS的数据分析[M].北京中国人民大学出版社2017. [百度学术

Xue Wei. Data analysis based on SPSS [M]. BeijingChina Renmin University Press2017. [百度学术

4

朱晓晗姜 红崔傲松. X射线荧光光谱法结合化学计量学检验橡胶手套的研究[J].化学研究与应用2020323):463. [百度学术

Zhu XiaohanJiang HongCui Aosong. X-ray fluorescence spectrometry combined with chemometrics for the inspection of rubber gloves [J]. Chemical Research and Application2020323): 463. [百度学术

5

朱晓晗姜 红.拉曼光谱法结合X射线荧光光谱法检验一次性塑料鞋套的研究[J].化学研究与应用20193111):1927. [百度学术

Zhu XiaohanJiang Hong. Study on the detection of disposable plastic shoe cover by Raman spectroscopy combined with X-ray fluorescence spectrometry [J]. Chemical Research and Application20193111): 1927. [百度学术

6

朱晓晗姜 红崔傲松.拉曼光谱法检验一次性塑料手套的研究[J].上海塑料20191):40. [百度学术

Zhu XiaohanJiang HongCui Aosonget al. Study on the detection of disposable plastic gloves by Raman spectroscopy [J]. Shanghai Plastics20191): 40. [百度学术

7

李 涛刘 闯谷 舟.无损鉴别古纸涂层及涂料的新方法[J].中国造纸20193812):27. [百度学术

LI TaoLIU ChuangGU Zhouet al. A New Method for Nondestructive Identification of Ancient Paper Coating [J]. China Pulp & Paper20193812): 27. [百度学术

8

马 枭姜 红杨佳琦.基于化学计量学的一次性塑料餐盒红外光谱分析[J].分析科学学报2020362):245. [百度学术

Ma XiaoJiang HongYang Jiaqiet al. Infrared spectrum analysis of disposable plastic lunch box based on chemometrics [J]. Journal of Analytical Science2020362): 245. [百度学术

9

姜 红任继伟鞠晨阳.X射线荧光光谱结合聚类分析检验药品铝塑包装片[J].化工新型材料20194711):194. [百度学术

Jiang HongRen JiweiJu Chenyanget al. X-ray fluorescence spectrometry combined with cluster analysis for the detection of drug aluminum plastic packaging tablets [J]. New Chemical Materials20194711): 194. [百度学术

10

王吉权邱立春王福林.因子分析法在高校教师教学质量评价中的应用[J].数学的实践与认识20114115):28. [百度学术

Wang JiquanQiu LichunWang Fulinet al. The application of factor analysis in the evaluation of teaching quality of university teachers [J]. Journal of Mathematics in Practice and Theory20114115): 28. [百度学术

11

董 鹍饶之帆杨晓云.几种塑料的拉曼光谱检测[J].塑料工业2011396):67. [百度学术

Dong XiaoRao ZhifanYang Xiaoyunet al. Raman spectrometric detection of several plastics [J]. China Plastics Industry2011396): 67. [百度学术

12

陈维娜吕辰晨杨春松.使用扫描电镜-电子能谱仪检验鉴别静电复印纸[J].中国造纸20173610):37. [百度学术

CHEN WeinaLYU ChenchenYANG Chunsonget al. Identification of Xerographic Paper by SEM-EDS [J]. China Pulp & Paper20173610): 37 [百度学术

CPP [百度学术