基于SVM及BPNN的辣椒红外光谱分析

  • 投稿Hunt
  • 更新时间2015-09-22
  • 阅读量307次
  • 评分4
  • 64
  • 0

李伟星,刘 刚,赵兴祥,王小龙,汪小华,李会梅

(云南师范大学物理与电子信息学院,昆明 650500)

摘要:利用小波变换结合反向传播网络(BPNN)和支持向量机(SVM)研究了朝天椒和灯笼椒的傅里叶变换红外(FTIR)光谱,样品1 750~950 cm-1范围的红外光谱经多尺度一维连续小波变换(CWT)和离散小波变换分析,发现第20尺度的连续小波系数,提取该尺度3个区域的系数作为特征参数建立BPNN和SVM 模型。结果表明,BPNN和SVM模型都能很好地区别两种辣椒。第5尺度的离散小波细节系数建立BPNN和SVM模型分类的正确率分别为93.3%、100%。小波变换结合BPNN和SVM用于傅里叶变换红外光谱技术中能够准确识别朝天椒、灯笼椒,为区分不同品种的辣椒提供了快速、有效的方法。

教育期刊网 http://www.jyqkw.com
关键词 :朝天椒;灯笼椒;人工神经网络;支持向量机

中图分类号:O657.33;S641.3文献标识码:A文章编号:0439-8114(2015)01-0203-03

DOI:10.14088/j.cnki.issn0439-8114.2015.01.053

Infrared Spectroscopic Analyses of Pepper based on

Support Vector Machine and BPNN

LI Wei-xing,LIU Gang,ZHAO Xing-xiang,WANG Xiao-long,WANG Xiao-hua,LI Hui-mei

(School of Physics and Electronic Information, Yunnan Normal University, Kunming 650500, China)

Abstract: Fourier transform infrared (FTIR) spectroscopy combined with back propagation neural network (BPNN), wavelet transform and support vector machine (SVM) were used to analyze Capsicum annuum L. var. conoide (Mill.) Irish and bell pepper. FTIR spectra of samples from C. annuum L. var. conoide (Mill.) Irish were obtained. The infrared spectra in the range of 1750~950 cm-1 were extracted by continuous wavelet transform (CWT) and discrete wavelet transform (DWT). The decomposition level 10 was obviously different. Three regions of this level were selected as feature vector to train BPNN and the SVM models. Discrete wavelet transform detail coefficients(DWTDC) of level 5 were selected to train BPNN and SVM models. The recognition accurate rate of using BPNN and SVM was 93.3% and 100%, respctively. It is proved that FTIR spectroscopy combined with BPNN and SVM can be used to discriminate C. annuum L. var. conoide (Mill.) Irish and bell pepper.

Key words: Capsicum annuum L. var. conoide (Mill.) Irish; bell pepper; back propagation neural network; support vector machine

收稿日期:2014-03-14

基金项目:国家自然科学基金项目(30960179)

作者简介:李伟星(1987-),男,湖南衡阳人,在读硕士研究生,研究方向为红外光谱生物医学光谱,(电话)18288745428(电子信箱)

weixl87@126.com;通信作者,刘 刚(1966-),男,云南陆良人,教授,主要从事生物医学光谱学方面的研究,(电话)13648878376

(电子信箱)gliu66@163.com。

辣椒(Capsicum annuum L.)包括辣椒和甜椒,又称番椒、海椒、辣子、辣角、秦椒等,是茄科辣椒属一年或多年生植物。辣椒中维生素C的含量在蔬菜中居第一位,具有通经活络、活血化瘀、驱风散寒、开胃健胃、补肝明目、温中下气、抑菌止痒和防腐驱虫等功效[1,2],被广泛应用于医药、轻化和食品行业。

区分辣椒常规的化学分析方法,如高效液相色谱法(HPLC)、气相色谱质谱法(GC-MS)、微卫星DNA标记(SSR)、超临界CO2萃取法等,这些检测方法虽然准确,但预处理过程复杂,耗时长,处理过程对人与环境有害[3]。傅里叶变换红外光谱法具有操作简单、灵敏度高、用样少、制样简单、重复性好等优点。小波变换是继傅里叶变换后的一种更为有效的信号处理方法[4]。人工神经网络(ANN)方法由于对非线性函数可任意逼近而在光谱分析中被广泛使用。人工神经网络具有高度智能化的特征与能力,在处理非线性问题上以计算简单、预测准确的优势在分析化学中得到了广泛的应用[5]。支持向量机(SVM)是近年来形成的一种新的模式识别方法,已表现出许多优于其他模式识别的方法。先通过非线性变换将输入空间变换到一个高维空间,然后在这个高维空间求取最优分类面[6]。

为此,选取两个品种的辣椒为研究对象,应用傅里叶变换红外光谱测定法得到FTIR,采用连续和离散小波多分辨率分析方法提取样品的红外光谱特征量,然后运用BP神经网络和支持向量机对两个品种的辣椒进行识别,旨在为同科属品种的植物提供一种分类方法。

1 材料与方法

1.1 试验仪器

红外光谱仪为PerkinElmer公司的Frontier傅里叶变换红外光谱仪,扫描范围4 000~400 cm-1,分辨率4 cm-1,扫描次数16次。

1.2 样品制备、检测及数据处理

朝天椒和灯笼椒采自湖南省农业科学院试验基地。朝天椒30个(编号a1~a30),灯笼椒30个(编号b1~b30)。样品清洗后晾干,取相同部位研磨成粉末,加入溴化钾研磨均匀,压片测红外光谱。光谱均扣除溴化钾背景,光谱数据用Omnic 8.0软件处理,经过基线校正、5点平滑处理、归一化。用Matlab 7.1软件进行支持向量机和BP神经网络分析。

2 结果与分析

2.1 两种辣椒果实红外光谱分析

图1是两个品种辣椒的原始光谱图。3 500~3 200 cm-1范围强宽峰为O-H与N-H的伸缩振动吸收,2 925 cm-1附近峰为亚甲基中C-H不对称伸缩振动吸收[7];2 857 cm-1附近峰为亚甲基中C-H对称伸缩振动吸收[8];1 735 cm-1附近吸收峰主要来自脂类C=O伸缩振动[9];1 635 cm-1附近吸收峰为辣椒碱中C=C双键伸缩振动峰[10];1 655、1 541 cm-1分别对应蛋白质的酰胺Ⅰ带和酰胺Ⅱ带的吸收峰[11]。1 610、1 516 cm-1为苯环的骨架特征伸缩振动吸收峰[12];1 440~1 330 cm-1范围的谱峰为蛋白质、纤维素、木质素等受氧、氮原子影响的甲基、亚甲基对称弯曲振动和CH3剪式振动吸收及C-H弯曲振动吸收,其中1 386 cm-1附近是蛋白质及纤维素的甲基和亚甲基的对称弯曲振动和甲基的剪式振动吸收[8];1 156~950 cm-1是多糖的C-O-C伸缩振动吸收峰[13];900~750 cm-1范围为糖类异构吸收区,其中895 cm-1附近为纤维素的环振动产生的C-H变形峰[14]。

2.2 傅里叶变换红外光谱连续小波变换分析

两种辣椒的傅里叶变换红外光谱的区别不是特别明显,直接应用其傅里叶变换红外光谱鉴别两种辣椒往往容易造成错误的分类。对它们的傅里叶变换红外光谱进行一维连续小波变换,在不同的分辨率下对其进行有效分析,能够放大它们之间的差别以有效鉴别两种辣椒。选择各向异性的Morlet小波作为“分析小波”,因为其频域能量比较集中,通频带较窄,频率混叠影响较小,具有时域对称和线性相位的特点,能够保证变换不失真[15]。对两种辣椒的傅里叶变换红外光谱中包括指纹区在内的区域(1 750~950 cm-1)进行一维连续小波变换,共进行了30尺度的一维连续小波变换,发现进行到第20个尺度的连续小波变换时的系数已能区别两种辣椒,变换结果见图2。

2.3 BP网络识别结果

BP神经网络一般由3个神经元层次组成,即输入层、隐含层和输出层。在BP网络的建立过程中,隐含层节点数的选择是关键。隐含层节点数的多少对BP网络的识别效果影响很大,隐含层节点数一般不大于输入信号的个数,隐含层节点数过多,网络易于区分各样本之间的细微差别,但网络的复杂程度增加,收敛速度减慢,增加网络训练时间,隐含层节点数h可通过公式(1)取整数确定初始值,再逐步增加或减少1~3节点数的方法选取最优值:

式中,p为输入变量数(即输入层节点数);q为输出变量数(即输出层节点数,通常为1)[16]。

选取第20尺度连续小波变换系数,第5尺度离散小波变换逼近系数和细节系数各19个变量作为网络输入值,输出层神经元个数为2,隐含层的神经元个数分别设定为1~12之间的整数值,60个样品,每个品种30个,其中训练组15个,测试组15个。通过比较分类正确率,最终确定隐含层神经元个数。网络的输入向量范围为[-1,1],隐含层神经元的传递函数采用S型正切函数tansig,输出模式为0-1,输出层神经元传递函数采用S形对数函数logsig。网络训练函数采用trainlm,学习函数为learngdm,最大次数为1 000,训练目标为0.01,学习速率为0.1。连续小波变换系数(CWTC)、离散小波变换逼近系数(DWTAC)和细节系数(DWTDC)作为网络输入变量的正确率随隐含层节点数变化情况如图3所示。连续小波变换系数和离散小波变换逼近系数训练神经网络最佳隐含层节点数均为7,而离散小波变换细节系数隐含层节点数对网络识别正确率没有影响,利用连续小波变换建立的BPNN模型的识别正确率为86.7%,而利用离散小波变换逼近系数和细节系数建立BPNN模型的正确率为93.3%、100.0%。可见离散小波的效果要比连续小波变换的效果好。

2.4 支持向量机结果

支持向量机法的基本思想来源于线性判别的最优分类面,所谓最优分类面就是要求分类面不但能将两类样本无错误地分开,而且要使分类空隙或分类间隔最大。通过实现最优分类面,一个直接的优点就是可以提高预测能力,降低分类错误率[16]。

用Matlab 7.1选用支持向量机4种核函数的线性函数作为核函数,利用离散小波变换细节系数建立支持向量机模型,对60个未知样品(训练组30个,测试组30个)预测结果支持向量机识别正确率见表1(表1中“1”代表朝天椒,“0”代表灯笼椒),结果表明,所有的样品都能识别,识别正确率为100%。

3 小结

利用傅里叶变换红外光谱技术结合小波变换、反向传播网络和支持向量机对朝天椒和灯笼椒进行识别,样品的红外光谱经一维连续小波变换,第20尺度系数存在着明显的差异,选取指纹区1 750~950 cm-1范围内的红外光谱进行5尺度离散小波变换,第5尺度小波细节系数存在明显的差异,利用该系数进行反向传播网络和支持向量机识别,其正确率分别为93.3%、100.0%。通过比较发现,离散小波细节系数建立模型比连续小波系数和离散小波近似系数效果好,但两者的差异不是很大。结果表明,小波变换结合支持向量机和反向传播网络应用于傅里叶变换红外光谱技术中能够识别朝天椒和灯笼椒,有望发展为鉴别不同品种物种的一种方便快捷的方法。

教育期刊网 http://www.jyqkw.com
参考文献

[1] 华景清,蔡 健.辣椒的药用价值[J].中国食物与营养,2004(12):52-53.

[2] 蒋慕东,王思明.辣椒在中国的传播及其影响[J].中国农史, 2005(2):17-27.

[3] WU Y H, DU Y P, ZHENG Y, et al. Study on difference between epidermis, phloem and xylem of Radix ginseng with near-infrared and infrared spectroscopy coupled with principal component analysis[J]. Vibrational Spectroscopy, 2011, 55(2): 201-206.

[4] 程存归,田玉梅,张长江.基于FTIR-CWT及ANN分类法的中药材菟丝子与同科属金灯藤子的识别方法研究[J].化学学报, 2008,66(7):793-798.

[5] CHENG C G, LIU L, CAO W Q, et al. Classification of two species of Bidens based on discrete stationary wavelet transform exraction of FTIR spectra combined with probability neural network[J]. Vibrational Spectroscopy, 2010, 54(1): 50-55.

[6] 金向军,张 勇,赵 冰,等.基于支持向量机及小波变换的人参红外光谱分析[J].光谱学与光谱分析,2009,29(3):656-660.

[7] YANG H, IRUDAYARAJ J, PARADKAR M M. Discriminant analysis of edible oils and fats by FTIR, FT-NIR and FT-Raman spectroscopy[J]. Food Chemistry, 2005, 93(1):25-32.

[8] SCHULZ H, BARANSKA M. Identification and quantification of valuable plant substances by IR and Raman spectroscopy[J]. Vibrational Spectroscopy, 2007, 43(1):13-25.

[9] KADAMNE J V, CASTRODALE C L, PROCTOR A. Measurement of conjugated linoleic acid(CLA) in CLA-Rich potato chips by ATR-FTIR spectroscopy[J]. Journal Agricultural and of Food Chemistry,2011,59(6):2190-2196.

[10] 张玮玮,刘玲玲,孙素琴,等.食用天然辣椒红色素中掺杂苏丹红的红外光谱快速识别[J].光谱学与光谱分析,2012,32(4):958-961.

[11] WU D, HE Y, FENG S J, et al. Study on infrared spectroscopy technique for fast measurement of protein content in milk powder based on LS-SVM[J]. Journal of Food Engineering, 2008, 84(1):124-131.

[12] 孙素琴,周 群,陈建波.中药红外光谱分析与鉴定[M].北京: 化学工业出版社,2010.

[13] 康玉秋,郭庆梅, 赵启韬,等.红外光谱法对贮藏白花丹参各部位的分析与评价[J].光散射学报,2011,23(4):387-395.

[14] DIGHTON J, MASCARENHAS M, ARBUCKLE-KEIL G A. Changing resources: assessment of leaf litter carbohydrate resource change at a microbial scale of resolution[J]. Soil Biology and Biochemistry,2001,33(10):1429-1432.

[15] 余 鹏,徐 锐,程存归.离散小波特征提取及人工神经网络分类法的傅里叶变换红外光谱法识别鳞毛蕨科3种植物[J].化学分析,2012,40(3):371-375.

[16] 陆婉珍.现代近红外光谱分析技术[M].北京:中国石化出版社, 2006.

(责任编辑 王晓芳)