摘要
为建立一种检验犯罪现场遗留一次性纸杯物证的科学有效的方法,利用拉曼光谱结合化学计量学对收集到的27个不同品牌、不同用途的一次性纸杯样本的拉曼特征峰峰位和峰强度的对比,对一次性纸杯样本进行区分。为了使分类结果科学准确,利用化学计量学的方法对光谱数据进行分析处理。为了减少聚类分析所用的变量个数,利用主成分分析法对拉曼光谱数据进行降维处理,指定提取3个因子,减少变量个数,保留大部分信息,其累计贡献率达99.09%。利用层次聚类和K-Means快速聚类将27个样本分为8类,并利用Fisher判别分析法验证了分类结果的科学合理性,从而对未知样本的类别判断提供依据。
作为许多家庭和公共场所中常用的饮水工具,一次性纸杯在各类案件现场都有可能会被提取到,为了使公安机关明确此类物证的侦破方向,通过对一次性纸杯进行拉曼光谱(RAMAN)检验和化学计量分析,根据各个纸杯的拉曼特征峰进而推测一次性纸杯的品牌、来源等相关信息。常见的一次性纸杯内壁主要淋膜食品级聚乙烯(PE)薄膜,用来隔水等用
为了使拉曼光谱检验一次性纸杯实验的分类结果更加科学合理,对样本拉曼光谱数据进行降维处理,选择主成分分析法,保留了一次性纸杯拉曼光谱数据的大部分信息。本研究以主成分分析法指定提取的因子作为变量进行层次聚类和K-Means快速聚类,对27个不同品牌、不通用途的一次性纸杯进行分类,利用Fisher判别分析法、聚类方法之间相互验证,在得到最佳聚类数的同时可直观看出样本各类别的类中心在判别分析图中的位置关系,实现对未知样本的类别判断,进而判断未知样本的品牌、来源等信息,该方法可为公安机关检验此类物证提供借
拉曼光谱(RAMAN)作为一种散射光谱,通过与入射光频率不同的散射光谱进行分析,进而得到所测样本分子振动、转动方面信息,并应用于分子结构研究的一种快速无损简便的分析方
因子分析的核心是用较少的互相独立的因子反映原有变量的绝大部分信息。本研究使用因子分析中的主成分分析法对拉曼光谱数据进行降维处理,将大量变量减少为3个变量。设有k个原有变量x1、x2、x3,…,xk,且每个变量(经标准化处理后)的均值均为0,标准差为1。现将每个原有变量用h(h<k)个因子f1、f2、f3,…,fh(标准化值)的线性组合来表示,见
(1) |
(2) |
式中,F为因子,由于出现在每个原有变量的线性表达式中,因此又称公共因子,fj(j=1,2,…,k)彼此不相关;A称为因子载荷矩阵;aij(i=1,2,…,p;j=1,2,…,k)称为载荷因子,是第i个原有变量在第j个因子上的载荷;ε称为特殊因子,表示原有变量不能被因子解释的部分,其均值为0,独立于fj(j=1,2,…,k)。
SPSS数据处理软件在层次聚类分析中,需要计算的是个体间的“亲疏程度”,根据个体间相似度和差异性对其进行测量。实验中使用平方欧式距离(SEUCLID)作为层次聚类计算方式,其数学表达式见
(3) |
式中,xi是个体x的第i个变量的变量值;yi是个体y的第i个变量的变量值。
根据27个一次性纸杯拉曼谱图(见

图1 27个一次性纸杯样本拉曼谱图比较
在进行拉曼光谱分析时,由于拉曼数据信息量庞大,存在信息重叠等问题,使得分析结果出现偏差,因此常常使用降维手段对数据进行处理,减少数据维数。主成分分析是一种常见的降维方法,在保留原数据主要信息的前提下,将多变量问题处理成一组新的相互无关的少数综合变量的问题,可以有效降低多个变量之间的信息重叠,提高分析结果的准确度。
因子fj方差贡献的数学定义见
(4) |
前k个因子的累计方差贡献率定义为
(5) |
在
为了实现对样本的分类研究,确保分类结果的合理性,利用SPSS分析软件对主成分分析法降维后的样本数据进行层次聚类与K-Means快速聚类分析。利用层次聚类中的凝聚方式聚类,首先,每个观测个体自成一类,再按照某种方法度量所有个体间的“亲疏程度”,并将其中最“亲密”的个体聚成一小类,形成n-1个类,然后再次度量剩余观测个体和小类间的“亲疏程度”,并将当前最亲密的个体或小类再聚成一类,重复上述过程,不断将所有个体和小类聚集成越来越大的类,直至所有个体聚到一起,形成一个巨大的类为止。K-Means快速聚类是一个反复迭代的过程,在聚类过程中,观测所属的类不断调整,直至最终达到稳定为止。
层次聚类结果表明,在并类距离为1时,27个一次性纸杯样本被分为8类。K-Means聚类分析法证明了层次聚类结果的合理性。
-1.02,-1.99)(1.15,0.39,1.19)(-0.39,-0.54,-0.98)(0.29,-0.17,0.63)(-0.45,-0.58,-0.03),这些中心点的数据展示了每一类样本在因子1、2、3下的最终聚类中心。
为了验证层次聚类和K-Means快速聚类的准确合理性,对数据进行Fisher判别分析,得到了8类样本在所建立的分类函数上的判别分析图。判别分析是一种经典的多元统计分析方法,用于对分类型变量取值的分析。Fisher判别分析是先投影再判别,投影是其核心。所谓投影,是将原来p维X空间的观测点投影到m(m≤p)维Y空间中(这里的Y空间称为Fisher判别空间)。

图2 Fisher判别分析图
以上聚类分析方法将27个一次性纸杯样本分为8类,所有一次性纸杯样本的分类结果见
本实验利用拉曼光谱仪结合化学计量学对27个不同品牌、不同用途的一次性纸杯样本进行检验研究。采用主成分分析和聚类方法对拉曼光谱数据进行处理,对纸杯进行聚类。
3.1 拉曼光谱结果表明,所得27个一次性纸杯样本拉曼光谱图中,样本均在1059、1125、1288和1429 c
3.2 为减少进行聚类分析时所用变量,对拉曼光谱数据进行主成分分析,指定提取3个因子,累计贡献率达到99.09%,在减少变量的同时,保存了大量信息。
3.3 以指定提取的3个因子作为变量进行层次聚类和K-Means快速聚类分析,将27个纸杯样本聚成了8类,并对K-Means算法下8类变量最终聚类中心点位置进行描述。根据未知一次性纸杯样本碎片的拉曼光谱检测结果可对其进行归类研究,进而推断未知样本的品牌和来源等信息。
3.4 在Fisher判别分析中,将8类变量的类中心位置在判别分析图中进行描绘,8类变量的类中心可以很好地区分开且各类别观测点分布相对比较集中,证明了聚类结果的科学合理性。
参考文献
姜 红,鞠晨阳,黄国玺,等.拉曼光谱法检验一次性纸杯的研究[J].黑龙江造纸,2018,46(4):4. [百度学术]
Jiang Hong, Ju Chenyang, Huang Guoxi, et al. Study on the detection of disposable paper cup by Raman spectroscopy [J]. Heilongjiang Pulp and Paper, 2018,46 (4): 4. [百度学术]
郭礼强, 刘 彭, 张轩恺, 等.高效液相色谱法快速检测纸杯中甲醛残留[J].中国造纸学报,2019,34(2):38. [百度学术]
GUO Liqiang, LIU Peng, ZHANG xuankai, et al. Rapid Determination of Formaldehyde Residue in Paper Cups by High Performance Liquid Chromatography [J]. Transactions of China Pulp and Paper, 2019,34 (2): 38 [百度学术]
薛 薇.基于SPSS的数据分析[M].北京:中国人民大学出版社,2017. [百度学术]
Xue Wei. Data analysis based on SPSS [M]. Beijing: China Renmin University Press, 2017. [百度学术]
朱晓晗,姜 红,崔傲松. X射线荧光光谱法结合化学计量学检验橡胶手套的研究[J].化学研究与应用,2020,32(3):463. [百度学术]
Zhu Xiaohan, Jiang Hong, Cui Aosong. X-ray fluorescence spectrometry combined with chemometrics for the inspection of rubber gloves [J]. Chemical Research and Application, 2020,32 (3): 463. [百度学术]
朱晓晗,姜 红.拉曼光谱法结合X射线荧光光谱法检验一次性塑料鞋套的研究[J].化学研究与应用,2019,31(11):1927. [百度学术]
Zhu Xiaohan, Jiang Hong. Study on the detection of disposable plastic shoe cover by Raman spectroscopy combined with X-ray fluorescence spectrometry [J]. Chemical Research and Application, 2019,31 (11): 1927. [百度学术]
朱晓晗,姜 红,崔傲松,等.拉曼光谱法检验一次性塑料手套的研究[J].上海塑料,2019(1):40. [百度学术]
Zhu Xiaohan, Jiang Hong, Cui Aosong, et al. Study on the detection of disposable plastic gloves by Raman spectroscopy [J]. Shanghai Plastics, 2019 (1): 40. [百度学术]
李 涛,刘 闯,谷 舟,等.无损鉴别古纸涂层及涂料的新方法[J].中国造纸,2019,38(12):27. [百度学术]
LI Tao, LIU Chuang, GU Zhou, et al. A New Method for Nondestructive Identification of Ancient Paper Coating [J]. China Pulp & Paper, 2019,38 (12): 27. [百度学术]
马 枭,姜 红,杨佳琦,等.基于化学计量学的一次性塑料餐盒红外光谱分析[J].分析科学学报,2020,36(2):245. [百度学术]
Ma Xiao, Jiang Hong, Yang Jiaqi, et al. Infrared spectrum analysis of disposable plastic lunch box based on chemometrics [J]. Journal of Analytical Science, 2020, 36 (2): 245. [百度学术]
姜 红,任继伟,鞠晨阳,等.X射线荧光光谱结合聚类分析检验药品铝塑包装片[J].化工新型材料,2019,47(11):194. [百度学术]
Jiang Hong, Ren Jiwei, Ju Chenyang, et al. X-ray fluorescence spectrometry combined with cluster analysis for the detection of drug aluminum plastic packaging tablets [J]. New Chemical Materials, 2019,47 (11): 194. [百度学术]
王吉权,邱立春,王福林,等.因子分析法在高校教师教学质量评价中的应用[J].数学的实践与认识,2011,41(15):28. [百度学术]
Wang Jiquan, Qiu Lichun, Wang Fulin, et al. The application of factor analysis in the evaluation of teaching quality of university teachers [J]. Journal of Mathematics in Practice and Theory, 2011,41 (15): 28. [百度学术]