一种最近邻线非参数鉴别分析算法

  • 投稿阿原
  • 更新时间2015-09-11
  • 阅读量694次
  • 评分4
  • 99
  • 0

张传娟

(江苏联合职业技术学院徐州经贸分院,江苏徐州221004)

摘要:特征提取是模式识别研究领域的一个热点问题。为了更好地解决人脸识别中的特征提取问题,在分布的非参数间距最大准则算法的基础上,根据最近邻线的算法思想,在点?线距离的基础上,提出一种新的算法,即最近邻线非参数鉴别分析算法,并通过在人脸数据库上的识别,验证了该算法的有效性。

教育期刊网 http://www.jyqkw.com
关键词 :特征提取;最近邻线非参数鉴别分析;算法;人脸识别

中图分类号:TN702.2?34;TP391.41 文献标识码:A 文章编号:1004?373X(2015)13?0145?04

收稿日期:2015?01?28

在线性特征提取方法中,通常采用Fisher线性鉴别准则[1?2]。但做特征提取时Fisher线性鉴别准则对原始样本的分布情况提出两个要求[3]:样本的分布须是单峰值的;每类样本均值须不同。但在实际应用中很难达到这两个要求。因此,Fukunaga等提出了非参数鉴别分析[4?5](Nonparametric Discriminant Analysis,NDA)的方法,这个方法将原先的Fisher鉴别准则法进行优化,即利用相应的散布矩阵差替代相应的散布矩阵的比值,不过NDA方法仍受相应的散布矩阵奇异的影响。因此,可用分步的非参数间距最大准则[6]算法来解决这个问题。根据最近邻线思想[7?10],在点?线距离的基础上提出了一种新的称为最近邻线非参数鉴别分析[11]的算法,并且通过在ORL人脸库进行实验识别验证了此算法的有效性。

1 间距最大准则(MMC)

MMC准则的目的是要将原始的高维空间数据压缩到低维空间并且仍然能够保证较好的可分性。所以,在特征提取的过程中,应当在变化之后的低维空间内保持类间距离的最大化。那么,特征提取的准则定义如下:

这样实现了不同类之间的距离最大,同类之间的距离最小,也就是使同类间距离最紧凑。

MMC的方法在一定范围内能有效地解决Fisher方法中产生的问题,但解决类内散布矩阵的问题还需要进一步探讨。Qiu 等提出了分步式非参数间距最大准则(Stepwise Nonparametric Margin Maximum Criterion,SNMMC)方法。

2 分步式非参数间距最大准则(SNMMC)

SNMMC的目的与MMC方法一样,尽量使类间距离最大而类内距离最小。在该算法设计中,不去具体定义类的中心点,只是考虑某一样本与它周围样本的分布情况,从而来定义相应的散布矩阵。算法的思想描述如下:对于一个样本x ∈ Ci (i = 1,2,?,C) ,那么定义相应的类间最近距离:

式中:α 作为一个控制参数来使用,取值在0到无穷大之间。这个样本的取值尽量不靠近样本中心点。公式(16)的值越大说明样本离类别的边界越近,反之值越小说明样本越靠近类中心。α 控制其变化的过程。

公式(12)和(13)给出,? ΔE ?i 表示的是样本xi 和不在样本xi 类中的最临近点之间的距离,而? ΔI ?i 表示的是样本xi 和属于样本xi 所在类空间内的最远点之间的距离。对于给定样本xi,相应的非参数距离可以表示如下:

对于一个样本xi 而言,相应的非参数距离大小可以去估计分类的准确性。即非参数距离值越小,样本分类的正确性越低,反之,值越大其正确率越高。

假设样本在进行特征提取后可以得到d 维空间的特征向量,可以得出一个转换矩阵W(n × d),由此得出投影矩阵xnew = W T x。投影之后的非参数类间和类内差异分别是:

式中:tr?( ) 代表矩阵的秩;S?b 和S?w 分别代表矩阵的非参数类间散布矩阵和矩阵的类内散布矩阵。

3.2 算法的实现

在本文的方法中,NNL算法可以用来对距离进行度量计算。这里可以通过相应的非参类间和类内距离来实现相关的散布矩阵。

算法中使用的非参类间和类内差异进行重新定义:

4 实验与分析

实验在ORL人脸数据库上进行。训练样本集的产生是从样本库中随机挑选每个类别中的9个人脸来进行,这样,训练样本集的人脸的个数就是40×9,测试样本集就是从余下的人脸数据产生,针对不同的训练样本数,均进行10次不相同的实验。其结果见表1,表2。

表1和表2分别显示了NNL?NDA 与其他经典的人脸识别算法在ORL 人脸数据库上的识别性能的比较;

图1和图2分别显示了在类别数目不同的情况下采用不同的分类器方法得到的识别率。

5 结语

本文在最近邻线思想的基础上,提出了一种新的特征提取方法——NNL?NDA 方法。在新方法中,特征提取的过程运用NNL的思想理论将样本的结构信息融入其中,通过在ORL人脸数据库中的实验,很好地验证了该算法的有效性。

教育期刊网 http://www.jyqkw.com
参考文献

[1] 戴文战,周昌亮.一种改进Fisher准则的线性鉴别分析方法[J].计算机工程与应用,2013(3):210?212.

[2] 崔法毅.改进的Fisher鉴别分析两步算法研究及其在人脸识别中的应用[D].秦皇岛:燕山大学,2012.

[3] CHENG Y Q,ZHUANG Y M,YANG J Y. Optimal fisher dis?criminant analysis using the rank decomposition [J]. PatternRecognition,1992,25(1):101?111.

[4] 曹林,陈登.基于小波近似分量非参数鉴别分析人脸识别算法[J].北京信息科技大学学报:自然科学版,2011(6):20?23.

[5] 薛寺中,戴飞,陈秀宏.一种非参数核函数鉴别分析法及其在人脸识别中的应用[J].计算机科学,2012(6):507?518.

[6] CHERKASSKY V,MULIER F. Learning from data:concepts,theory and methods [M]. New York:John Viley & Sons,1997.

[7] 仲媛.最近邻分类的若干改进算法研究[D].南京:南京理工大学,2012.

[8] VICKERS A J. Parametric versus non?parametric statistics inthe analysis of randomized trials with non?normally distributeddata [J]. BMC Medical Research Methodology,2005,5(1):1?12.

[9] 金忠,杨静宇,陆建峰.一种具有统计不相关性的最优鉴别矢量集[J].计算机学报,1999,22(10):1105?1108.

[10] BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J. Ei?genfaces vs. fisherfaces:recognition using class specific linearprojection [C]// 1996 the 4th European Conference on ComputerVision Cambridge. UK:ECCV,1996,19(7):711?720.

[11] 郑宇杰.特征提取方法及其应用研究[D].南京:南京理工大学,1996.

作者简介:张传娟,硕士,讲师。研究方向为应用电子技术。