海南省大健康产业人才需求多元回归预测模型的构建———基于主成分分析与趋势外推组合

  • 投稿吉田
  • 更新时间2017-11-01
  • 阅读量572次
  • 评分4
  • 34
  • 0
[基金项目]本文受海南省哲学社会科学规划课题“海南省大健康产业人才需求预测及人才引进留存对策研究”(项目编号:HNSK(QN)16-30)资助。

[作者简介]陈燕莹(1985—),女,广东潮州人,海南医学院管理学院讲师,工商管理学硕士,研究方向:人力资源、卫生经济,健康服务与管理;通信作者:黑启明,男,法学博士、经济学博士后,教授、博士生导师,海南医学院管理学院常务副院长,研究方向:劳动关系与人力资源管理。

2016年10月25日,国务院发布《“健康中国2030”规划纲要》,明确健康中国的战略目标是,到2020年,建立覆盖城乡居民的中国特色基本医疗卫生制度,健康素养水平持续提高,人人享有基本医疗卫生服务和基本体育,主要健康指标居于中高收入国家之列。到2030年,促进全民健康的制度体系更加完善,健康服务质量和健康保障水平不断提高,健康产业繁荣发展,基本实现健康水平,主要健康指标进入高收入国家行列。[1]

为了保障健康服务指标建设的达成,健康服务尤其是医疗服务质量的改善与提高,促使整个社会基本医疗卫生服务的可负担,如何确保合理的健康服务人才的供给与布局,能够相对准确科学地进行一个国家或者一个区域的健康产业人才的需求预测,明晰影响健康产业人才需求的因素就成为值得重点研究的问题之一。

在加快建设国际旅游岛的背景下,健康服务业已成为海南省现实需求最大、增长速度最快的现代服务业之一。到2020年,全省健康服务业总规模达到1000亿元以上,健康服务业占GDP比重达到15%左右,成为推动经济社会持续发展的重要力量。为了实现这一目标,海南省必然需要大量的健康服务业专业人才,而截至2015年年底海南省统计年鉴及“十二五”期间卫生科教工作总结文件的统计数据显示,海南省每千常住人口执业(助理)医师数达到2.09人,每千常住人口注册护士数达到2.71人,医护比为1∶1.30,每千常住人口执业药师数达到0.31人,距离国家《“健康中国2030”规划纲要》要求的健康指标均存在一定的差距,例如,到2015年,每千常住人口执业(助理)医师应达到2.2人,到2020年,达到2.5人,到2030年,达到3.0人;到2020年,每千常住人口注册护士数应达到3.14人,到2030年,达到4.7人;到2020年,每千常住人口执业药师数应达到0.6人。

1 人才需求预测方法的研究现状

总体而言,我国目前的人才需求预测工作还十分薄弱,很多行业还没有建立起具有宏观指导性,自身行业独特的人才需求特征指标体系和规范化的预测模型。大部分的人才需求预测还停留在企业预测层面,大多采用传统的时序外推法,只考虑时间序列因素,不关注外部因素造成的影响,当外部经济环境、政策冲击加上人口流动迁移发生重大变化时,传统的预测方法将难以适应人才预测的需要。

Scheffler等(2008)[2]是首位从国家间的角度,使用合适的纵向数据对158个国家的医师人数的供求数量及是否符合世卫组织的基本健康服务覆盖的需求门槛进行预测的学者。

Jenny X Liu、Yevgeniy Goryakin、Akiko Maeda等(2017)[3]基于经济学供需模型以经济增长、人口规模、健康水平覆盖程度为解释变量,使用世界卫生组织健康市场劳动力观察报告中的165个国家从1990年至2013年的健康市场劳动力数据对2030年的全球健康市场劳动力需求进行预测。结果发现到2030年,全球需要各类健康卫生技术人才高达8000万人,为2013年的两倍,而世界范围内劳动力的净短缺达到1500万人。随着经济增长、人口增长及人口老龄化,对健康市场劳动力需求的高增长将由高收入国家向中等偏高收入国家转移。大量的人才短缺会加剧国家间健康卫生技术人才的全球争夺与竞争。由于供不应求,中等收入国家会面临大量人才短缺。与此相反,低收入国家将面临供求双方的低增长,看似不会面临人才短缺的现象,但是健康卫生人员的数量远远低于世卫组织对基本健康服务覆盖所要求的人员需求门槛。

我国人才需求预测分析起始于20世纪80年代,经济增长的腾飞伴随着大量的人才需求,因此拥有以经济增长的有关数据为基础的预测传统,以人才需求量作为预测量,进行预测模型设计。这种思路容易忽视科学技术与知识的变革与叠代更替带来的产业结构升级和核心竞争优势的转变,进而对人才数量与其结构变化的影响。

人才需求影响的因素很多,涉及社会、经济、科技等多种因素,很多地区的人才统计数据在1988年才开始建立,样本数据很少,历史数据遗漏与错误现象严重,存在“维度灾难”的问题。目前人才需求预测的模型建立方法有以下五种:一是时序趋势外推预测法;二是多元回归模型;三是灰色预测模型;四是神经网络预测模型;五是差分自回归移动平均法与最小二乘支持向量机(ARIMA-LSSVM)组合预测模型等。

赵东旭(2015)[4]基于趋势外推法对吉林省2001—2013年的接待入境旅游人数以时间t为自变量,时序数值y为因变量进行二次曲线的模型拟合,然后基于该模型对未来8年(2014—2021年)的入境旅游人数进行预测,平均误差较小,方程拟合较好,有较高的预测精度。这种方法是对特定时间序列建立的静态模型,只可根据时间序列的长度进行未来短中期(4~5年或近10年)的预测,由于预测时刻越远,受到的干扰影响因素就越大,预测的精度就会下降,因而难以建立长期预测模型。

王小平、陈敏等(2014)[5]选取涉及宏观经济因素、社会环境因素、对外经济因素、技术因素四类23种指标构建基于上海市金融业从业人员数量和这23种指标因素间的回归预测模型。文中利用主成分分析方法解决共线性问题,提取2个公因子,并利用公因子构建线性回归预测模型。通过预测模型估测的上海市金融业从业人员数量与实际就业人员数量相比,回归模型具有较好的预测结果。这类模型预测的方法能够清晰直观地解释所要分析问题的影响因素,容易理解问题背后深层次的内在联结与相互影响。但其缺点也非常明显,选择影响因素无可避免具有极强的主观性,可能造成遗漏了重要的相关因素或挑选了次要因素,因而影响了预测因素的精确性。另外,这类模型目标变量的预测是基于解释变量的预测值可以获得的前提下的,具有一定的局限性,对历史数据的获取量比较多。

胡雪花(2009)[6]首先从经济、社会、科学技术、涉外经济四个方面进行分析,建立了人才需求预测系统的指标体系,选取了32个指标,结合了相关性分析和灰度关联分析,建立了三种灰色预测模型,并在实际数据的检验下选择了等维动态GOM模型作为指标预测的最优模型。在对指标分析建模的基础上,建立了基于灰色理论的BP神经网络人才需求预测模型,并与此前的等维GOM模型进行模型优劣比较,在此基础上,提出了基于灰色理论的Elman神经网络的改进模型。最后实证结果表明,Elman神经网络预测模型能够结合灰色理论和神经网络两者对人才需求历史数据不足达到双重降维的优点以及充分利用各指标信息,反映人才系统动态性和指标影响的动态化,具有强线性拟合特性和较强的适用性。

通过以上研究可知,各种预测方法皆存在自身的优劣势和适用的数据条件,而至今没有学者运用科学的人才需求预测方法对医疗卫生行业乃至整个大健康产业的人才需求情况进行合理的预测工作。因此,本文以海南省为例,尝试对海南省的大健康产业的人才需求预测进行分析,为现实研究提供可借鉴之处。

2 海南省大健康产业人才需求预测指标选择

多元线性回归分析方法是常用的统计学方法,它可以利用收集到的历史数据或者观察数据去尝试拟合模型,以研究学者关心的目标变量与解释变量之间的线性关系,检验解释变量的显著性特征和对模型的影响作用大小,进而可以通过两个或两个以上的变量去解释和预测另一个变量的关系。

根据劳动经济学的理论,劳动需求是一种“派生需求”,雇主之所以要雇用劳动力,是为了生产、销售产品或者提供服务以获得收益。根据传统经济学的厂商理论,从宏观角度上看,生产函数Q=(L,K),从中可以看出,产量的增长不仅依靠资本投入的增长,也凭借着劳动力的增加或者劳动生产率的提高。这取决于全社会的资本投资规模和科学技术革新突破带来的生产率低增长。从微观层度来看,各个企业的劳动力需求的变化,受限于产量的变化以及工资率的变化。而劳动力的需求变化还受到了劳动力供给的制约,除了工资因素外,还取决于所在国家或地区的人口规模、人口结构、人口流动、所处的经济周期以及其他相关制度和政策冲击的影响。

因此,依据现有的文献指标选择方法,结合各方面收集到的资料和访谈专家的意见,在考虑指标数据的易得性、适用性,以及不同行业研究对象上的差异性,本文选取了三类共20个指标进行预测分析,具体见表1。

3 海南省大健康产业人才需求预测模型的构建

3.1相关性及共线性分析

本文初步以海南省卫生人员总量作为因变量(记为y1),以上述20个指标作为自变量(即X1,…,X20),运用2009—2015年的历史数据资料,建立回归预测模型。

在做回归分析之前,先利用统计软件spss 23.0中文版对海南省卫生人员总量y1与20个指标因素之间的相关程度进行考察,运用Pearson相关分析检验法,其相关系数参见表1。

从相关系数上看,在5%的置信水平下,海南省卫生人员总量与全省居民消费价格指数、全省医疗保健和个人用品消费价格指数以及全省商品零售价格指数的相关系数分别为-0.136、-0.115和-0.250,相关性较小,可将这三种价格指数予以剔除;同时,海南省卫生人员总量和海南省全员劳动率以及海南省进口总额的相关系数虽为0.553和0.679,因其相关系数相对小于其他系数指标,且没有达到5%的置信水平,故依然把这两种指标剔除;除了上述剔除的5种指标因素外,其余的15种指标与海南省卫生人员总量具有极大的相关性,相关系数大,几乎都在0.9以上,而且都是正相关。

从这20种指标因素的相关因素上看,个别指标之间的相关系数达到了0.8以上,存在共线性问题,因此需要对20个自变量进行共线性诊断,共线性相关指标参见表2和表3。

由表2和表3可以看出,共线性诊断给出了容差(Tolerance)和方差膨胀因子(VIF)、特征值(Eigenvalue)、条件索引(Condition Index)和方差比例(Variance Proportions)的值。根据统计学的标准判断,如若容差≤0.1或VIF≥10,条件索引>10或者方差比例>0.5,特征根越小等,可判断自变量间存在共线性。表2和表3表明,部分自变量间存在明显的共线性。

3.2海南省大健康产业人才需求模型的构建

为了解决自变量间存在的共线性问题,同时尽可能多地保留人才需求影响因素的变量,本文先采用主成分分析方法构建回归模型。

通过主成分分析法的碎石图(见图1)可知,对解释自变量进行降维处理,可以提前2个因子。根据旋转因子载荷表(见表4)和主成分因子成分图(见图2),可得到主成分因子公式,见式(1)至式(3)。

a.旋转后在3次叠代后已收敛。

F1=0.916X17+0.814X3+0.811X4+0.808X15+0.795X10+0.781X9+0.770X16+0.728X13+0.719X12+0.716X11+0.709X5(1)

F2=0.915X20+0.757X18+0.726X2+0.718X1(2)

经过主成分分析后,提取2个公因子,利用F1和F2两个公因子构建回归模型,根据散点图可知,海南省卫生人员总量和两个公因子之间存在线性关系,因此构建的多元线性回归模型为:

y1=a+b1F1+b2F2+u(3)

其中,y1为海南省卫生人员总量,a为常数项,b1、b2为回归系数,u为随机误差项。

从表5中的R2和调整后的R2的值可以看出构建的回归方程拟合度较好。从表6的方差分析表中的F值及其的显著性Sig.的概率值小于0.001,说明多个自变量和因变量之间存在线性相关关系。将表7中的回归系数代入式(3)中,可得到海南省卫生人员总量预测模型为:

y1=59841.857+5995.327F1+4847.101F2(4)

将式(1)和式(2)代入式(4),可得,

y1=59841.857+5995.327(0.916X17+0.814X3+0.811X4+0.808X15+0.795X10+0.781X9+0.770X16+0.728X13+0.719X12+0.716X11+0.709X5)+4847.101(0.915X20+0.757X18+0.726X2+0.718X1)(5)

根据上述得出的海南省卫生人员总量预测模型,将海南省2009—2015年的各项数据代入式(4)中,相关数据见表8。

由表8可看出回归模型的预测值与实际值比较一致,绝对误差均小于3%,除了2012年,其他年份的绝对误差均小于1.3%。根据表8,将实际值和预测值,得到更直观的图形表示,见图3。从图3可以直观地看出海南省卫生人员总量的预测值的变化趋势基本反映了实际值的变化趋势。由此判断,本文构建的回归预测模型用来预测海南省卫生人员总量的预测值偏差率较低,可靠度比较高。

同理,可用相同的回归模型预测方法对目标变量海南省卫生技术人员y2、海南省执业(助理)医师人数y3、海南省执业医师人数y4、海南省注册护士人数y5、海南省执业药师人数y6、海南省大健康产业管理人员总数y7进行预测,见表9。

由表9的海南省大健康产业各类卫生技术人员以及管理人员总数的实际值与预测值的比较表可以得知,本文选取的大健康产业人才需求预测指标体系相对比较合理,能够通用与不同类型人才需求的预测,且各类人员总数的绝对误差均小于5.3%,大多数低于3%,且都集中于2012年这一相对较异常的年份。通过观察可以发现在各项指标数据整体上扬时,尤其是卫生和社会人员的平均工资于2012年还出现较大幅度增长的同时,全省执业(助理)医师人数和执业医师人数反而较2011年出现小幅减少的情况,导致这一年的绝对误差相对较大。而在此之前的2011年并没有出现重大的卫生人力政策的冲击和经济大环境的明显恶化,而执业医师资格考试的录取分数线和通过率并没有明显的变化,因此,不排除因各地薪酬增加产生人才流动的可能性。综上所述,可以发现本文构建的多元回归预测模型拟合度较高,预测精度较好,可靠性较强。

3.3结合趋势外推法进行未来预测

由于多元回归预测模型具有较好的解释能力,但是解释变量的未来值现实中较难取得,因此需要靠趋势外推法,将所有影响因素都全部归结于时间这一变量,假定事物发展过程中没有跳跃的非线性变化,事物发展的因素也影响着事物未来的发展,其条件不变或者变化不大。根据对人才需求预测指标体系数据的观察,各项指标数据均呈上升趋势,并无明显的波动,其变化趋势大多呈抛物线递增趋势,因此可以用时间t为自变量,各项指标的时序数值为因变量,运用二次曲线进行分别拟合,运用模型进行未来值预测,再将各项指标的未来值代入多元回归方程中进行目标变量的预测,这就是将多元回归预测与时序外推法相结合的组合预测法。通过趋势外推法的二次曲线拟合模型,各项指标的显著性均小于0.03,都具有统计学意义,可以进行未来值预测的同时代入多元回归方程,因此可得到海南大健康产业2016—2020年未来五年的预测值,见表10。

根据表10的预测值,到2020年,海南省的常住人口达到965.24万人,此时,每千常住人口执业(助理)医师预计达到2.85人,超过“健康2030”规划于2020年达到2.5人的标准;每千常住人口注册护士数预计达到3.67人,超过“健康2030”规划于2020达到3.14人的标准;每千常住人口执业药师数预计达到0.4人,未符合“健康2030”规划于2020达到0.6人的标准。因此,由预测值可以看出,通过构建的模型,海南省大健康产业人才需求中,作为健康产业的支柱细分产业医疗卫生服务行业的执业(助理)人数和注册护士人数随着模型的自然增长能够满足当地卫生服务的需求和达到国家规划的标准,但其他医药、公共卫生、卫生技术、健康服务等细分行业的人才需求还有很大的缺口,应把人才建设与教育培育、财政投入、政策支持倾向于这些行业的人才发展工作。

4 研究展望

本文利用主成分分析多元回归方法构建了海南省大健康产业的各类人才需求预测模型,经过实际数据计算,构建模型的预测值和实际值比较接近,预测效果较好。但由于数据周期较短,海南省早年间的很多数据没有进行统计,尤其是卫生总费用数据的统计及卫生人员的收入数据早年间还没有纳入统计范畴,具体数据较少,在做具体回归分析上可能存在数据不足导致的精确性下降问题。另外,海南省作为得天独厚的自然条件旅游大省,到冬季很多候鸟型的游客会季节性地长达数月在海南过冬,但海南省常住型和流动型候鸟人口的数据于2011年才纳入海南省的统计学年鉴,数量接近常住人口的1/4,因此海南省大健康产业整体的人才需求比预测值理论上应该再上浮1.25倍左右,才能满足真实的健康服务需求和负荷。同时,在今后的研究中希望能够结合多种预测模型,如灰度预测模型、神经网络预测模型、ARIMA-LSSVM等模型,进行比较分析,找出更精确的预测模型,更准确地预测人才需求量。此外,还希望对全省大健康产业人才的初、中、高端各层次分布的合理性和地域分布的公正性以及其他影响人才需求与流动的因素进一步地研究,以期为海南省的大健康产业人才建设与规划政策提供数据支持和决策工具。

参考文献

[1]国务院.“健康中国2030”规划纲要[EB/OL].(2016-10-25).http://www.gov.cn/zhengce/2016-10/25/content_5124174.htm.

[2]Scheffler R M,Liu J X,Kinfu Y,et al.Forecasting the Global Shortage of Physicians: An Economic- and Needs-based Approach[J].Bull World Health Organ,2008,86(7):516-523B.

[3]Jenny X Liu,Yevgeniy Goryakin,Akiko Maeda,et al. Global Health Workforce Labor Market Projections for 2030[J].Human Resource for Health,2017(15):11-23.

[4]赵东旭.基于趋势外推法的吉林省英语旅游人才需求预测及培养对策[J].职业技术教育,2015(20).

[5]王小平,陈敏,胡瑞文.上海金融人才预测需求模型的构建[J].上海商学院学报,2015,2(15).

[6]胡雪花.基于灰色理论和神经网络的人才需求预测模型[D].广东:中山大学,2009.