2. 国家卫生和计划生育委员会 北京 100044
2. National Health and Family Planning Commission, Beijing 100044, China
优化医疗卫生服务体系的资源配置,需要根据不同地区的发展制定有针对性的策略。我国各地卫生资源发展不平衡,根据《2014年中国卫生和计划生育统计年鉴》,2013年山东省800张床位以上的医院数量全国最多,达106家,而青海、宁夏、海南仅有4家;北京市2013年千人口执业(助理)医师数5.85人,而贵州仅为1.31人。[1]我国东中西部经济社会发展差距较大,进一步加剧了医疗卫生资源配置的不平衡,影响居民公平享有医疗卫生服务的基本权益。合理划分卫生区域,有利于准确把握不同地区医疗卫生资源配置规律,找准薄弱环节,对区域卫生发展给予政策调控,具有一定的现实意义。
这些年来,一些学者研究了中国的经济区域划分。[2, 3, 4]1985年,区域经济学家陈栋生将我国经济地带划分为“六大经济区”,即东北、黄河流域、长江流域、南方、新疆、西藏六大经济区。20世纪80年代末到90年代初,经济学家刘再兴根据全国生产力总体布局提出把全国划分为六个一级经济区:东北区,黄河中下游区,长江中下游区,东南沿海区,西南区,西北区。2006年6月,国务院发展研究中心发布的《地区协调发展的战略和政策》报告提出新的综合经济区域划分设想,把中国内地划分为八大综合经济区域。然而,在医疗卫生资源配置领域,学者主要针对局部地区进行卫生资源配置的区域划分,较少对全国卫生资源配置的区域划分开展研究,且很少综合考虑经济、人口、社会、健康等因素进行卫生区域划分研究。[5, 6, 7]本文将系统考虑经济、人口、社会、健康等因素,利用主成分分析及因子分析等方法对我国31个省(自治区、直辖市)进行卫生区域划分。
本研究数据来源自《2014年中国统计年鉴》及《2014年中国卫生和计划生育统计年鉴》。为合理划分卫生区域,研究综合考虑不同地区经济、社会、人口、健康及卫生资源状况,全面收集了2013年全国31个省(自治区、直辖市)的经济、社会、人口、健康四个方面相关指标。经济指标主要包括:人均GDP、人均财政收入与支出、人均卫生支出、城镇居民人均可支配收入、农村居民人均可支配收入;社会发展指标主要包括:城市人口密度、城镇化率、15岁以上人口文盲率等;人口指标主要包括:常住人口数、城镇人口数、农业人口数、地区面积、性别比、65岁以上人口比例、出生率等;居民健康状况指标主要包括:平均期望寿命、婴儿死亡率、5岁以下儿童死亡率等;卫生资源状况指标主要包括:医院数、基层医疗卫生机构数、卫生技术人员数、执业(助理)医师数等。
根据所筛选指标应与分类目标密切相关,且具有灵敏性、代表性、实用性等原则,经过专家咨询最终确定12个指标作为区域划分的依据,分别为地区人均GDP、地区人均财政收入、城镇居民可支配收入、农村居民可支配收入、城市人口密度、城镇化率、15岁以上人口文盲比例、65岁以上人口比例、期望寿命、婴儿死亡率、千人口执业(助理)医师数、每万平方公里医院数。其中,人均GDP、地区人均财政收入可较好反映地区经济水平,城镇居民可支配收入及农村居民可支配收入则能较好地反映地区居民的经济实力;城市人口密度、城镇化率、15岁以上人口文盲率能分别反映地区城市建设发展、城市化水平及教育发展情况;65岁以上人口比例主要体现地区老龄化水平;期望寿命可以衡量地区居民的健康水平,并且婴儿死亡率也是反映一个地区居民健康水平及妇幼保健工作水平的重要指标;千人口执业(助理)医师数体现地区卫生人力资源配置,每万平方公里医院数反映地区医院配置,以上两个指标能较好体现地区卫生人力和物力资源的配置情况。
通过主成分分析及因子分析法构建综合指标,根据得到的客观赋权综合指标运用聚类分析定量区分不同类别地区。主成分分析是数学上的一种降维方法,基本思想是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标,同时根据需要从中选取几个较少的综合指标尽可能多地反映原来指标的信息。[8]相比之下,因子分析是用少数几个因子描述多个变量之间的关系,被描述的变量是可以观测的随机变量,而因子是不可观测的潜在变量。[9]在获得主成分及因子综合得分的基础上,利用聚类分析根据综合得分将不同地区进行分类,最后再对因子分析和主成分分析聚类结果进行比较验证。为保证所有指标具有正向关系,对15岁以上人口文盲比例及婴儿死亡率进行指标变换,分别转变为15岁以上人口非文盲比例,婴儿死亡率的倒数。之后,再将这些变量进行标准化,标准化后所有变量的均值为0,方差为1。使用SPSS软件进行主成分分析、因子分析和聚类分析。[10, 11, 12]
以2013年我国31个省(自治区、直辖市)的数据进行比较(表 1):经济状况方面,北京、上海均具有较高水平,而云南、甘肃、贵州等地水平较低,不同地区差异较大。社会发展方面,2013年我国城市密度最大的地区是陕西和河南,城市每平方公里的人口数约为5000;城市人口密度最小的地区为内蒙古,城市每平方公里的人口数约为1 059;经济较好地区的城镇化率较高,上海的城镇化率达到89.61%,其次是北京为86.2%,西藏最低仅为22.8%;全国仅西藏、青海和贵州三地的15岁以上人口文盲比例高于10%,其中西藏为41.19%,北京最低为1.52%,说明我国居民受教育程度差异较大。人口状况,以地区65岁人口比例超过7%为老龄化社会的标准来看,2013年我国29个省(自治区、直辖市)的65岁以上人口数均超过了7%,重庆市的比例最高达到13.25%,西藏最低为5.17%。在居民健康方面,北京、上海的期望寿命最高,2010年分别达到80.18岁和80.26岁,西藏最低,为68.17岁;北京的婴儿死亡率最低,为2.52‰,西藏的婴儿死亡率最高,为19.97‰。在卫生资源配置方面,北京的卫生资源配置较丰富,其千人口执业(助理)医生数达到5.58人,每万平方公里的医院数达363家,而贵州的千人口执业(助理)医生数最低,仅为1.31人,西藏每万平方公里的医院数最少,仅为1家。总体来看,上海、北京等地区经济状况、社会发展、人口健康、卫生资源等均发展较好,而西藏、甘肃、贵州等地则较差。
对上述指标进行主成分分析,得到特征值及解释方差比例(表 2)。第一主成分特征值为7.69,能够解释所有指标64.09%的变异;第二主成分特征值为1.58,可解释13.16%的变异;第三主成分特征值为1.00,能解释8.33%的变异。三个主成分累计解释方差比例达到85.58%,选择前三个主成分计算各个地区的主成分得分。
主成分是原始变量的线性组合,主成分载荷矩阵中的每一列代表了一个主成分作为原始变量经标准化后得到的新变量的线性组合的相关系数。相关系数的绝对值越大,表明该主成分对相应变量的代表性越大。第一主成分与人均GDP、人均财政收入、城镇居民可支配收入、农村居民可支配收入、城镇化率、期望寿命、婴儿死亡率(倒数)、千人口执业(助理)医师数、每万平方公里医院数的相关性较强,对经济、健康、卫生资源指标的解释充分,该主成分可以作为评价地区经济、健康及卫生资源配置水平的指标。第二主成分与65岁以上人口比例、15岁以上非文盲比例有较高相关性,可认为是代表人口及教育发展情况。第三主成分主要与城市人口密度的相关性较强,代表着城市建设发展情况。
根据特征向量,计算2013年各地区的主成分综合得分(表 4),其中上海得分最高,为4.92,其次是北京,为4.69,西藏最低,为-3.64分。
利用SPSS软件对上述指标进行因子分析,得到特征值及贡献率(表 5)。初始因子解释方差与主成分分析结果相同,因子旋转后四个公因子的特征值均大于1,第一公因子特征值为6.73,方差贡献率为56.12%;第二公因子方差贡献率为14.80%,第三公因子方差贡献率为10.57%,第四公因子为9.09%;累计贡献率达到90.58%。因子旋转后,公因子方差贡献发生了变化,但四个公共因子总信息量未发生改变。
对四个公因子进行解释。从表 6可以看出,第一因子主要解释人均GDP、人均财政收入、城镇居民可支配收入、农村居民可支配收入、城镇化率、期望寿命、婴儿死亡率、千人口执业(助理)医师数、每万平方公里医院数,是地区经济、健康及卫生资源因子;第二因子主要解释15岁以上人口非文盲比例,是地区教育发展因子;第三因子主要解释65岁以上人口比例,是地区人口老龄化因子;第四因子主要解释城市人口密度,是地区城市发展因子。
为了对这些地区的整体状况进行综合评价,计算不同地区的各公因子的得分,以各公因子的贡献率为权数乘以不同地区相应因子得分,并通过求和得到不同地区因子综合得分。由表 7可以看出,上海因子得分最高,为1.91,其次是北京,为1.58,西藏得分最低,为-0.87。各地区因子综合得分排名与主成分综合得分排名不完全一样,但总体上,因子得分排名与主成分得分类似。
聚类是按照某个特定标准(一般为距离准则)把一个数据集分割成不同的类或簇,使在同一簇内的数据对象的相似性尽可能大,同时不在同一簇中的数据对象差异性尽可能大,即聚类后同一类别的数据尽可能的聚集在一起,而不同类的数据尽量分离。通过对不同地区的主成分及因子综合得分数据进行聚类分析,得到聚类树状图(图 1)。
按主成分综合得分聚类树状图如图 1左侧,可将各地分为6个区域:第一类地区为上海市、北京市;第二类地区为天津市;第三类地区为江苏省、浙江省;第四类地区为广东省、辽宁省、山东省、福建省、内蒙古自治区、吉林省、重庆市、陕西省、湖北省、黑龙江省、山西省、河南省、湖南省、河北省、海南省、四川省、江西省、安徽省、广西壮族自治区、宁夏回族自治区、新疆维吾尔自治区;第五类地区为贵州省、青海省、云南省、甘肃省;第六类地区为西藏自治区。
按因子综合得分聚类树状图如图 1右侧,总体可分为6个区域。第一类地区为上海市、北京市;第二类地区为天津市;第三类地区为江苏省、浙江省;第四类地区为广东省、安徽省、海南省、新疆维吾尔自治区、湖南省、湖北省、河北省、内蒙古自治区、重庆市、四川省、山西省、吉林省、江西省、陕西省、辽宁省、河南省、山东省、福建省、黑龙江省、广西壮族自治区、宁夏回族自治区;第五类地区为贵州省、青海省、云南省、甘肃省;第六类地区为西藏自治区(表 8)。
本文利用2013年全国31个省(自治区、直辖市)的经济、人口、社会、居民健康、卫生资源等方面的指标,通过主成分分析及因子分析法分别构建地区综合指标,再根据得到的客观综合指标,利用聚类分析定量划分各类卫生区域。其中,人均GDP、地区人均财政总收入、城镇居民人均可支配收入、乡村居民年人均纯收入能很好地反映地区经济状况;城镇化率、人口密度、15岁以上人口文盲比例能较好的代表地区社会发展状况。关于卫生指标的选择,本研究主要介绍卫生区域划分方法,目的是为卫生资源配置提供依据,各地卫生服务需求指标应纳入分类指标之中,即2013年各地居民两周患病率,但该指标不可获得,难以纳入分类指标体系之中,因此本研究主要通过居民健康状况来间接反映卫生服务需求因素。从分析结果看,地区65岁以上人口比例、期望寿命、婴儿死亡率可以较好反映地区的健康状况,千人口医师数及每万平方公里公立医院数可以反映卫生资源配置状况,这些指标基本能够满足研究需求。利用这些指标构建综合指标体系可以较好反映不同地区的经济、社会、人口健康及卫生发展状况。
研究使用两种分析方法,对我国31个省(自治区、直辖市)进行卫生资源配置的区域划分。从结果看,按照主成分和因子分析综合得分进行的区域划分结果相似(表 8);不同之处是,在主成分综合得分中,聚类分析将广东省、广西壮族自治区、宁夏回族自治区的归为第四类地区,而在因子综合得分中,将广东省分为第三类地区,将广西壮族自治区、宁夏回族自治区分为第五类地区。其中,广东省的主成分综合得分为1.08,相邻两省的主成分综合得分分别为浙江省1.83,辽宁省0.77。虽然广东省得分与辽宁省更接近,但广东省得分高于1分,远高于第四组内其他省的得分。因此结合因子得分聚类分析结果,广东省归为第三类地区更为合理。同样,对于广西壮族自治区、宁夏回族自治区,两者的主成分综合得分分别为-0.96(约等于-1)和-1.17,与第五类地区的得分更近似,应将其归为第五类地区,与因子综合得分聚类结果一致。此外,新疆维吾尔族自治区的主成分综合得分及因子综合得分分别为-1.22分和-0.29分,在主成分综合得分中,其与宁夏回族自治区得分更接近,应属于第五类地区;在因子得分中,其与海南省得分更接近,应属于第四类地区。但由于新疆维吾尔族自治区属于经济发展极不平衡、人口密度较小、卫生资源配置较不足的地区,因此更适宜归为第五类地区。总的来看,两种分析方法得到的地区综合得分的分类结果类似,主成分分析和因子分析方法获得的分类结果相互验证,可以较好地反映各地卫生区域综合划分情况排名。
卫生区域划分是一个动态的分析方法,随着各地的发展,卫生区域划分也将随之变化。采取这种方法可以动态地调整我国卫生区域划分,合理规划地区卫生资源。与以往采用相对简单的中东西卫生区域分类方法相比,本研究的卫生区域分类研究更细化,可以更好的体现不同地区经济、社会、人口、健康状况的差异,更适合作为卫生资源配置的区域分类方法。
我国幅员辽阔,地区之间经济社会发展不平衡,区域医疗卫生发展水平差距较大,影响居民公平享有基本医疗卫生服务。有必要构建科学合理的中国卫生区域划分体系,因地制宜规划区域卫生资源的配置及政府投入政策。
综合应用两种分析方法的分类结果,按照经济、社会、人口、健康和卫生资源等发展水平和状况将我国31个省(自治区、直辖市)分为六个卫生区域。第一类地区属于经济发达、人口密度大、健康水平较高、卫生资源丰富的地区,包括上海市、北京市。第二类地区属于经济发达、人口密度一般、健康水平较高、卫生资源比较丰富的地区,为天津市。第三类地区属于经济较发达、人口密度较大、健康水平较高、卫生资源较丰富的地区,包括江苏省、浙江省、广东省。第四类地区属于经济发展中等、人口密度较大、健康水平一般、卫生资源配置总体尚可的地区,包括山东省、福建省、辽宁省、重庆市、陕西省、内蒙古自治区、吉林省、湖北省、河南省、黑龙江省、湖南省、山西省、河北省、江西省、安徽省、海南省、四川省。第五类地区属于经济欠发达或发展极不平衡、人口密度较小、健康水平较低、卫生资源配置较不足的地区,包括广西壮族自治区、宁夏回族自治区、新疆维吾尔自治区、贵州省、甘肃省、青海省、云南省。第六类地区属于经济欠发达、人口密度小、健康水平低、卫生资源配置不足的地区,为西藏自治区。
《全国医疗卫生服务体系规划纲要(2015—2020年)》已出台实施,该纲要运用卫生区域分类测算结果,综合考虑了经济、社会、人口、老龄化、城镇化等因素,结合床位数历史变化趋势,借鉴经合组织(OECD)国家人均GDP与我国2020年水平相当时的千人口床位数,对全国不同卫生区域的资源配置标准进行测算,最终提出了到2020年我国每千常住人口医疗卫生机构床位数配置标准。[13]卫生区域分类可以更准确地对不同地区卫生发展状况进行定位和政策选择,更加客观地对不同区域的卫生资源配置给予政策调控,为合理布局不同地区医疗卫生资源总量和公立医疗卫生机构建设提供依据。
[1] | 国家卫生和计划生育委员会. 中国卫生和计划生育统计年鉴[M]. 北京: 中国协和医科大学出版社, 2014. |
[2] | 宋岭, 魏秀丽. 中国经济区域划分综述[J]. 新疆财经,2000(2): 47-49. |
[3] | 金相郁. 中国区域划分的层次聚类分析[J]. 城市规划汇刊, 2004(2): 23-28. |
[4] | 刘忠颖. 中国经济区域划分[D]. 沈阳: 东北师范大学, 2007. |
[5] | 杨艳新, 买买提·牙森, 姜婷, 等. 新疆卫生资源配置的区域分类研究[J]. 中国卫生经济, 2011, 30(6): 84-85. |
[6] | 万崇华, 蔡乐, 李晓梅, 等. 云南省区域卫生规划中区域分类标志值的确定方法[J]. 中国卫生统计, 2003(2):13-15. |
[7] | 张亮. 云南省卫生资源配置区域分类指标及方法研究[D]. 昆明: 昆明医学院, 2003. |
[8] | 郭显光. 如何用SPSS软件进行主成分分析[J]. 统计与信息论坛, 1998(2): 61-65. |
[9] | 王芳. 主成分分析与因子分析的异同比较及应用[J]. 统计教育, 2003(5): 14-17. |
[10] | 林海明. 如何用SPSS软件一步算出主成分得分值[J]. 统计与信息论坛, 2007(5): 15-17. |
[11] | 周衍庆, 王有邦, 李新运. SPSS的聚类分析功能在经济地理分区中的应用[J]. 枣庄师范专科学校学报, 2003(5): 10-15. |
[12] | 何亮. 主成分分析在SPSS中的应用[J]. 山西农业大学学报, 2007(S1): 20-22. |
[13] | 中国医学科学院医学信息研究所. 卫生服务体系规划与资源配置研究报告[R]. 北京, 2014. |
(编辑 刘 博)