货币金融服务板块的主成分聚类分析

［摘要］文章利用主成分分析与聚类分析法对金融业中货币金融服务板块的16只股票的2016年会计年度综合财务状况进行了系统分析。首先按营运能力、盈利能力、发展能力、股本扩张能力将11个财务指标归纳为4个一级指标，并对其进行主成分分析，再利用提取出的主成分进行聚类分析。希望通过对上述银行业上市公司客观全面的综合分析，为中小投资者提供理性的投资参考数据，帮助其选取财务状况良好、具有发展潜力的股票，最大限度地提升股票投资价值。

［关键词］银行板块；主成分聚类分析；综合评价

［DOI］10．13939/j．cnki．zgsc．2017．30．034

［作者简介］刘宇珊（1996—），女，汉族，湖北黄冈人，就读于北京工业大学，研究方向：财务数据分析与挖掘。

1 引言

1．1研究背景及意义

随着我国宏观经济的进入持续稳定增长的“新常态”，近几年国内银行业的景气度持续回升，上市银行也面临难得的发展机遇，在资产规模、资产质量、盈利能力等方面都取得了骄人的成绩。银行板块是蓝筹股的重要代表，工商银行、中国银行等银行股成为主力机构调控股票指数的重要工具，上证综合指数是以其总股本来确定权重。

依据财务报表对银行板块上市公司综合实力的评价的重要性就愈加显现出来。

本文以证监会2012年版行业分类中的16家银行的2016年度财务数据作为考察样本，在计算影响综合实力指标的基础上，用主成分聚类分析方法来进行评价，进而得出不同能力指标下的结果，对其进行综合分析并给出相应建议。

1．2国内外研究现状

综述当前的研究现状，以及本文的研究问题和研究思路

刘倩（2010）得出主成分分析可以有效解决我国企业财务数据高维性和多重共线性的特点,使判别模型更具说服力，但只针对28家上市创业板公司做了研究，数据量不够大，说服力不够强。

王德清等（2012）针对经典聚类分析和普通主成分聚类分析极端情形下的失效问题展开讨论,通过定义客观赋权的主成分距离为分类统计量,并以实证检验取得良好效果为依据,有效地解决了主成分聚类分析在极端情形下所不能揭示的问题。

国外学者做过一些利用数据挖掘算法来分析预测客户行为的研究，例如，采用K-median聚类算法对超级商场消费者的偏好情况进行细分。［5］采用K-means、SOM（self-organizing map）、Fuzzy K-means聚类算法对股票交易客户进行细分［6］。运用模糊聚类算法对在线音乐爱好者进行用户细分等。［7］

2 研究方法

2．1主成分聚类分析法

在多指标综合评估的排序问题中，若主成分累计贡献率不够大，即提取出的主成分表达的原始数据不够完整全面，仅按主成分得分对样品直接排序评价会有片面性，这时候可以将主成分分析与聚类分析两种统计方法联系起来，称为“主成分聚类分析”。

将主成分分析与聚类分析相结合，即先进行主成分分析，然后对提取出的几个主成分进行聚类分析，结合主成分的综合排序进行对象分类排名。这种方法一是可以降低指标的维数，将复杂的问题简化;二是可以对聚类分析方法中的每一类进行评价，根据每一类的主成分得分进行排名，得到的排名结果更符合实际。

2．2聚类分析方法的原理

本文采用的K-means聚类分析算法是麦奎因提出，算法的要点先确定K值，然后将数据集划分成K类，然后进行反复迭代，把每一个样本重新分配到距离最近的中心类别中。

2．3聚类分析分类数的确定

K-均值聚类分析方法能够将数据群体迅速、合理地划分成K个子群体，比较适合解决大量数据信息的问题。对于K-均值聚类分析算法，需要着重考虑K值。这是本算法的关键步骤，对聚类产生的结果有很大的影响。

K-均值法具体分类数的确定，离不开实践经验的积累，可以反复进行多次的初值选择，根据各个产生的聚类结果中找出最优的分类。但我们这里借助系统聚类法以一部分样本为对象进行聚类，其结果作为K-均值聚类分析法确定类数的参考。

2．4主成分聚类分析的计算步骤

设有n个样品，每个样品观测p个指标，将原始数据写成矩阵

（1）将原始数据标准化。这里不妨设上述矩阵已标准化了。

（2）建立变量的相关系数阵：

（3）求R的特征根

λ1≥λ2≥…≥λn＞0

及相应的单位特征向量：

（4）计算写出主要成分

Fi=a1X1+a2X2+…+aPxP

计算主成分贡献率及累计贡献率

√贡献率

√累计贡献率

一般取累计贡献率达85%~95%的特征值λ1,λ2,…,λm所对应的第1，第2，…，第m（m≤p）个主成分。

（5）求p个观测对象在前m个主成分的得分。根据各个主成分的贡献率进行加权求和。

（6）根据前m个主成分得分运用K-均值聚类，得到个案的类别，依据主成分分析确定每个个项的类别排名，并进行综合评价。

3 综合评价因子分析

3．1指标变量的选取分类及公式计算

选取了11个变量指标，较全面地反映银行上市公司的基本财务状况。

表1上市公司综合评价指标体系

3．2主成分聚类分析

本文使用spss 17．0统计分析软件，选取上述11个变量的财务指标，

采用主成分探索性因子分析以及K-均值聚类分析方法的对16家上市银行的基本财务状况进行综合评价研究。数据来源于《国泰安CSMAR系列研究数据库》。下面将进行过程分析及解释。

主成分分析是用于把众多相关变量缩减为较少的不相关的主成分变量的一种方法。因此，用于主成分分析的原始变量之间必须有相关性，如果变量之间相互独立，则无法用主成分分析法来进行数据降维，但如果每一个变量反映的信息都不相同，没有任何冗余信息，这种数据分析方法是没有用武之地的。检验变量之间的相关程度，判断是否适用主成分分析法，需要用到KMO和Bartlett球形检验。

KMO统计量比较样本相关系数和样本偏相关系数，它的取值在0和1之间，该值越大，则样本数据越适用于主成分和因子分析。一般要求大于0．5，方可运用这种分析方法。根据Kaiser(1974)给出的经验原则，0．549的适合性为middling(中度的)。如果显著性值小于0．05，则认为主成分分析是适宜的。本例中卡方值为193．895，大于卡方的临界值18，显著性值小于0．05，故主成分分析法可以应用在此案例中。

（1）主成分的统计信息

根据标准化公式处理原始数据，由此计算出各数据变量的相关系数矩阵R，以及相关系数的特征值、贡献率和累计贡献率。

上表显示了主成分的统计信息，包括特征值由大到小的次序排列，各主成分的贡献率及累积贡献率。第一主成分的特征值为4．677，它解释了11个原变量的总方差的42．516%（因子旋转前），第二主成分的特征值为3．143，它解释了11个原变量的总方差的28．576%，前三个特征值的累积贡献率为85．796%，即前四个主成分包含了原有变量指标的85．796%的信息，所以本例中可以取前三个主成分来替代原始十一个指标。

（2）旋转后的因子载荷矩阵

通过四次方最大旋转后，得到了11个变量在3个因子上的新的因子载荷。结果显示，因子1支配的变量有X3（净资产收益率）、X5（基本每股收益）、X9（每股净资产）、X10（每股资本公积）、X11（每股未分配利润）。

因子2支配的变量有X2（总资产净利润率ROA）、X3（净资产收益率）、X4（营业净利率TTM）、X8（营业总收入增长率）。

因子3与X1（营运指数）、X6（总资产增长率）、X7（净利润增长率）有很强的相关关系。

故可以粗略地认为，因子1集中反映银行每股价值指标，称为综合扩张因子；因子2重点反映资产与营业收入的各方面情况，称为盈利发展因子。根据（现金）营运指数定义，它反映企业现金回收质量、衡量现金风险的指标，同时这个主成分体现企业在规模扩大、增加盈利等方面的表现，即总资产、净利润的增长率，故因子3可称为风险价值因子。

Method: Principal Component Analysis．

Extraction Method:Principal

Component Analysis．

Rotation Method:Quartimax with

Kaiser Normalization．

a．Rotation converged in 5 iterations．

（3）因子得分系数矩阵及主成分得分

SPSS可以将通过旋转后计算的4个因子得分Z1、Z2、Z3、Z4作为新变量自动存储到原始数据文件中，操作为｛转换｝→｛计算变量｝，如表4所示，Y为最终得分，根据以上分析，可了解各个指标的潜在本质。

具体来说，根据各个主成分的贡献率进行加权求和，因子旋转后三个主成分更精确的特征值分别是4．373、2．703、2．361。因此综合得分为：

Y=4．373/9．437Z1+2．703/9．437Z2+2．361/9．437Z3

在主成分得分表中，我们可以看到宁波银行、民生银行、兴业银行、华夏银行和南京银行表现突出，综合排名在前五。这些银行大多是区域性银行，依托经济活跃的地带，发展势头很好，而排名较靠后的建设银行、北京银行、农业银行、工商银行和中国银行，除北京银行外其余四家网点遍布全国，资本雄厚，基础较好，已经过了股本快速扩张的阶段，也许是这个原因让这几家银行的各项指标数相对较低。

4 板块的聚类分析

聚类分析对于变量的选择比较重要，一般变量个数越多，得到的类越难以解释。依上例，选取的代表上市银行财务状况的数据变量比较多，考虑先用主成分分析法进行降维，然后应用主成分变量做聚类变量进行聚类分析。

K-均值法是一种比较流行的动态聚类法，选择一批凝聚点或给出一个初始的分类，让样本按某种原则向凝聚点聚拢，对凝聚点进行不断的修改或迭代，直至分类比较合理、迭代稳定为止。

在SPSS中选择K-均值聚类分析可得到类成员列表。上图第三列Cluster给出了每个个案所属的类，第四列Distance显示的是个案和所属类中心的距离。经过20次迭代计算，对比结果，我们发现选择分类数为5较合理，既能有效分离数据，又能呈现较小的聚合系数。

5 研究结论

5．1研究结论

根据上述主成分聚类分析可得出：

第一类有兴业银行与招商银行，这两家银行在综合扩张方面表现突出，分别排序1、2，虽然在主成分分析法下排名中上（第3与第6），但根据银行区别于一般企业的性质特点，可以认为财务状况良好，具有较大的发展潜力。

第三类有建设银行、北京银行、工商银行、农业银行和中国银行，与主成分加权综合得分后五名的排序一致，这几家在上市公司中属于老牌银行，实力雄厚，股本很大，在一定程度上影响了各项能力指标，综合表现不是很突出。在图7最后聚类中心的表中也可以看出，第三类的指数较低。

第二、四和五类的银行，在综合扩张、盈利发展和风险价值三个方面处于中等水平，主成分的综合评分也是不好不坏，采取保守策略的投资者可以选择这些银行。

综上所述，相对于只采用主成分分析法，对主成分法提取的因子进行聚类分析的方法能更为精确地解释主成分综合加权排名。

关于模型的合理性，本文选取了四个指标，衡量盈利、发展、营运能力的变量较为全面地概括了企业当前的财务状况。值得一提的是，针对商业银行的行业特点创新地选取了股本扩张能力这一指标，这是比较切合实际的。

5．2对策建议

5．2．1外部环境方面

由于金融业是当前国际激烈经济竞争的关键环节，而商业银行体系是现代金融的核心，我国的资本市场相对于发达国家还不成熟，银行部门在国民经济的运行中发挥着重要作用，在资本充足率、资产质量以及创新能力上需改进提高。

5．2．2行业现状方面

互联网金融对传统银行业有很大的冲击，时代发展浪潮下，人们已经习惯新的支付方式，加之融资渠道的丰富多元化，传统商业银行该思考如何去改变。

5．2．3资源能力方面

首先，商业银行需积极地进行金融产品的开发，认真研究竞争对手的情况，切实做到以客户需求为中心，以市场细分为基础，不断开发出满足不同类型客户需要的产品。尤其是要加大开发和扩展高附加值产品的力度，逐步形成自己的特色，适时推出同类银行难以模仿的金融产品，推动商业银行的金融创新，改善商业银行的产品结构，借以树立专有的名牌产品，增强盈利能力，提高竞争力，降低信用风险。

其次，商业银行应开展金融产品研制，仔细研究竞争对手的情况，切实以客户需求为中心，以市场细分为基础，不断开发满足不同客户需求的产品。特别是增加高附加值产品的发展壮大而努力，逐渐形成了自己的特色，类似银行理财产品及时引进模仿，促进商业银行的金融创新，提高商业银行的产品结构，建立自主品牌产品，提高盈利能力，增强竞争能力，有效地使信用风险降低。

最后，建议监管部门降低准入门槛，试点实行逐步放松银行业管制。如此在一定程度上提高银行业的稳定性，降低银行风险。在减低银行业进入障碍的同时，应更多地允许具有区域关系型借贷优势并符合条件的民间金融机构进入银行业，遏止银行之间由于竞争度上升而带来的风险。

5．2．4业务流程与组织系统方面

商业银行业务流程是指商业银行直接或间接地为顾客创造价值的一系列相关活动的有序集合。一套有序高效的业务流程有助于增强银行的价值创造能力。因此，需要对业务流程进行优化。具体可以采取下列做法。

（1）简化业务流程。业务简化流程，减少不必要的活动，结合业务流程重新规划各项流程过程或活动，或串并联转换改造流程，以为了缩短营业时间，合理配置人力资源，节约成本和有效地增加新的业务目标的数量目的。例如，那些效率低下的非核心业务外包，集中在人力、物力和财力资源的核心业务上，给客户提供最高效、最全面的业务服务。

（2）建立差异化流程。为了满足客户多样化的需求，需建立差异化的业务流程，最大限度使客户满意，与此同时加强客户关系的管理，最大化实现客户价值。

参考文献：

［1］何晓群．多元统计分析［M］.4版．北京:中国人民大学出版社，2015．

［2］赖国毅,陈超．SPSS 17．0中文版常用功能与应用实例精讲［M］.北京:北京电子工业出版社，2010．

［3］刘倩．基于主成分聚类分析的中小企业成长研究［J］.统计与决策，2011（16）．

［4］王德清,朱建平,谢邦昌．主成分聚类有效性的思考［J］.统计研究，2012（11）．

［5］Jean-Paul Ruiz，Jean-Charles Chebat，Pierre Hansen． Another Trip to the Mall：A Segmentation Study of Customers Based on Their Activities［J］.Journal of Retailing and Consumer Services，2004(11)：333-350．

［6］H．W．Shin，S．Y． Sohn． Segmentation of Stock Trading Customers According to Potential Value［J］． Expert Systems with Applications，2004（27）：27-33．

［7］Muammer Ozer． User Segmentation of Online Music Services Using Fuzzy Clustering［J］.Omega，2001（29）：193-206．