中国卫生政策研究  2019, Vol. 12 Issue (4): 20-26   DOI: 10.3969/j.issn.1674-2982.2019.04.004   PDF    
衡量县级公立医院变革力的新视角:基于力场模型的指标评价
张静1,2, 王虎峰2,3, 崔兆涵3     
1. 国家神经系统疾病临床医学研究中心(首都医科大学附属北京天坛医院) 北京 100070;
2. 中国人民大学医改研究中心 北京 100872;
3. 中国人民大学公共管理学院 北京 100872
摘要:目的:本研究引入卢因组织变革理论的力场模型,针对“县政府、县政府医改相关职能部门、县级公立医院”这一组织单元构建综合指标体系进行变革力评价。方法:综合应用半结构访谈、德尔菲法、文本分析、锚定分级、配对分析、文献研究等方法进行评价体系开发、指标体系无量纲化处理、评价指标体系案例验证和评价体系的三角互证。结果:构建了反映我国县级公立医院综合改革变革力的综合评价指标体系,由驱动力和制约力双向指标体系组成,共包含指标84项,可以量化得出改革的驱动力和制约力,以及力场变化趋势;并采用三角互证法对指标体系的效度进行了检验。结论:指标体系的评价视角与评价方式具有创新性,可用于我国县级公立医院综合改革过程中的评价,深入直观地解释改革的经验和遇到的问题以及改革发展不平衡的原因,同时对城市公立医院综合改革的评价具有较强的借鉴意义。
关键词公立医院综合改革    卢因力场模型    变革力    指标体系    评价    
A new perspective to measure the transformational power of county-level public hospitals:A study based on the force-field model indicators
ZHANG Jing1,2, WANG Hu-feng2,3, CUI Zhao-han3     
1. China National Clinical Research Center for Neurological Diseases(Beijing Tiantan Hospital, Capital Medical University), Beijing 100070, China;
2. Health Reform and Development Center of Renmin University of China, Beijing 100872, China;
3. School of Public Administration and Policy, Renmin University of China, Beijing 100872, China
Abstract: Objective: This study introduces the Lewin's force-field analysis change theory model and constructs a comprehensive indicator system for conducting the evaluation of change in the organizational unit consisting of "county government, county government medical reform departments, county-level public hospitals". Methods: Semi-structure interview, Delphi method, content analysis, anchored rating scale, matching analysis, literature research and other methods are used practically and theoretically in developing the evaluation system, quantifying the indicator system, and validating the evaluation indicator system. Results: In this paper, a comprehensive evaluation indicator system that reflects the transformational power of county hospital comprehensive reform in China is constructed. It consists of a set of two opposite forces, namely driving forces and restraining forces, and the power of change can be quantified by the embedded 84 indicators. A case study and triangulation are deployed to validate and test the robustness of the comprehensive indicator system. Conclusion: The evaluation perspective and evaluation method of the indicator system are innovative and can be used in the evaluation process of the comprehensive reform of county-level public hospitals in China. The experiences and challenges encountered in the reform and the reasons for the imbalance of reform and development are explained in depth and intuitively. The evaluation of comprehensive reform of urban public hospitals has a strong significance for reference.
Key words: Comprehensive reform of public hospitals    Lewin's force-field model    Transformational power    Indicator system    Evaluation    

2015年,我国县级公立医院综合改革全面推开后,国内出现了一批改革的典型地区,但各地改革政策执行的总体情况却不平衡,仍有相当多的地区改革政策难以落地。在县级公立医院综合改革顶层制度设计已较为完备的情况下,为何各地改革政策执行和推进如此不平衡?为了科学地解释和评价这一现象,找出政策执行环节存在的问题,本文以跟踪调研的几个改革试点和典型地区的客观资料为基础,尝试引入组织变革理论开发科学评价的工具,衡量分析改革进程中组织变革力的现实情况。因此,该研究选择了卢因组织变革理论的力场分析模型作为框架,基于2015年《国务院办公厅关于全面推开县级公立医院综合改革的实施意见》(国办发〔2015〕33号),从改革的驱动力和制约力两个方向构建改革变革力测评指标体系,审视改革政策执行过程中驱动和阻碍的力量对比,有针对性地评价改革得以推进和受阻的因素。从而为今后县级公立医院综合改革的深入推进提供理论借鉴和工具参考。

1 资料与方法 1.1 研究对象

本文的研究对象最终确定为“县政府、县政府医改相关的职能部门、县级公立医院”这一组织单元,其源于两方因素:一是我国县级公立医院综合改革的现实,二是政策执行理论的第三代“整合式”研究途径。33号文件传递出这项改革不仅是单体医院的改革,也不只是涉及县级公立医院这个群体,还涉及到中央与地方、不同层级政府内部部门之间、政府不同职能部门之间以及政府与县级医院之间的多种关系。同时,当前主流的政策执行理论也考虑了当下现实社会政策执行的复杂性、多元性。温特的“规划过程—执行结果”模型中,代表执行过程的中介变项也包含了组织和组织间执行、基层官员行为、目标群体等多个变量。[1-3]

1.2 资料来源

本文研究对象确定和指标体系构建参考模型的理论基础均来源于CNKI、Pubmed等数据库所获取的重点文献;二、三级指标的选择依据源自33号文件;案例样本资料获取来自于4个案例地区的客观数据上报,共涉及被访谈者79人,政策文件459份、总结报告和会议纪要41份、访谈记录9份、历史性数据1 846条。

1.3 研究方法与技术路线

本文综合运用文献法、半结构访谈、德尔菲专家法、文本分析、锚定分级、配对分析等多种方法来构建测评指标体系。主要技术路线包括(图 1):(1)测评指标体系的开发:引入卢因组织变革理论和力场分析模型及33号文件中的政策任务要点构建测评指标体系;(2)综合评价体系形成:运用多种方法对指标实施无量纲化处理,使测评指标体系具有可操作性、横向可比性;(3)测评指标体系验证:将综合评价体系应用于案例地区进行评价及验证;(4)三角互证:将案例研究结论与其他来源证据进行比对,相互解释和印证,检验指标体系的有效性。[4]

图 1 技术路线
1.4 理论依据

库尔特·卢因(Kurt Lewin)在其“三阶段”组织变革理论中提出了解冻Vnfreezing—变革Conversion—再冻结Refreezing三个阶段。他指出成功的变革要对现状进行解冻,然后变革到一种新的状态,并对新的变革给予再冻结,并使之保持稳定持久,并在这个理论中构建了力场分析模型(图 2),其中驱动力和制约力是一对既对抗又平衡的力量,单独增加变革的驱动力会导致组织张力变大。如尽量降低变革的制约力则更有效果,它使得变革向期望的状态发展,而不会增加组织张力。[5-6]基于这一理论基础,遵循卢因力场模型的框架,本研究分析解构了33号文件,将政策要点中进行变革的力量划分为两个部分:一是驱动变革的政策措施,一是要求执行对象克服变革阻力的政策措施,由此作为构建双向测评指标体系的基础。

资料来源:Lewin.Group Decision and Social Change[M]. 1952. 图 2 卢因力场模型
1.5 研究过程 1.5.1 模型改良

本文选取英国NHS使用的力场分析模型[7],结合我国县级公立医院综合改革政策及实践进一步改良,作为构建双向测评指标体系的一级框架(图 3)。该框架在驱动力一侧仍沿用了NHS的5个维度指标,而在制约力一侧则根据我国县级公立医院综合改革政策内容,将原模型中的“既有工作模式”分解为“既有管理体制”和“既有运行机制”两项指标,其他维度保持不变,以利于测评操作。选取该模型的理由是我国的县级公立医院作为国家卫生服务体系中的重要组成部分,其与NHS有着相同的应用领域,并且被应用的组织也与本文将要研究的县级公立医院有着高度的相似性。

图 3 本文改良后的力场分析模型[7]
1.5.2 测评指标的选择

(1) 一级指标选取

采用NHS模型中的指标作为本文变革力指标体系中的一级指标(图 4)。其中驱动力包括5个指标:竞争、新技术、激励、管理压力、新人力;制约力包括4个指标:技能缺乏、职业不安全、安于现状、既有工作模式。[7]

图 4 县级公立医院综合改革变革力测评指标体系构建步骤

(2) 二、三级指标初步筛取

从“33号文件”目标出发,所有有利于建立和推进新机制形成的举措为驱动改革的力量,而改革所要破除的旧机制,以及变革旧机制所遇到的阻抗为制约改革的力量。将政策中属于驱动力量的政策措施划入驱动力方向,对于可能产生改革阻抗的力量(被破除、被考核、被监管、被统筹、被加强、被要求)划入制约力方向。

(3) 一级指标的拓展

在NHS模型的基础上对二、三级指标所对应的一级指标进行扩展,其中针对改革实践中存在的突出问题,如“三医联动机制尚不健全,部门利益消解不力,协同掣肘,改革的深度、广度和力度都未展现出来”和“对既有利益的触动还较浅,药品生产流通使用领域改革不全面,药价虚高问题依然存在,医疗服务价格动态调整不能实现,对医疗机构和医疗技术劳务价值的补偿不能体现”这两个问题,本文在NHS原模型的制约力一级指标基础上新增了1个指标,即“既有工作模式”,修改为“既有管理体制”和“既有运行机制”,以适应我国公立医院体制机制改革的情况。

(4) 测评指标体系的初步建构

为了使力场模型发挥作用,需要在感知、严格和客观的情况下识别出这些力,再次对指标进行遴选,遴选的原则包括可操作性和可测量性,其中变革阻力的指标要考虑到组织、社会和个人等多个层面。经过以上的几个步骤,可获得待论证的县级公立医院综合改革确立的变革力测评指标体系。

1.5.3 德尔菲专家法筛选并形成测评指标体系

按照如上形成的测评初步架构,结合半结构访谈的内容,通过吸收课题组专家小组讨论意见,形成了驱动力和制约力共86项指标。再经35位专家两轮函询,对指标的重要性以及专家判断依据和其对指标的熟悉度进行判断赋分,函询赋分部分详见表 1

表 1 专家函询表的赋分部分
1.5.4 无量纲化处理

无量纲化处理是综合评价步骤中的一个环节,将指标体系中不同类别指标按不同方法处置后变得可以比较和衡量,从而实现指标体系的可运用,以此对评价对象进行整体比较。

1.5.5 测评指标体系的应用与验证

本文选取了4个示范、试点地区,应用本研究确立的变革力测评指标体系对案例的改革政策执行和改革推动工作进行评价、打分,对案例地区的测评结果进行分析和比较,尝试分析和解释究竟是示范地区驱动了改革,还是化解了变革中的阻力,或是综合运用了两种方法,其重点和关键环节是什么。这既是对测评指标体系的应用,同时也是对现实改革的实际成效即社会评价等结果与指标体系测评结果进行比较和互证,来验证变革力指标测评体系的有效性。

2 结果 2.1 德尔菲专家函询结果 2.1.1 两轮专家函询的积极系数

专家的积极系数是指专家咨询表的回收率,可以反映专家对研究的积极程度。第一轮和第二轮专家的积极性和对本研究的关心程度都比较高,问卷全部有效,且回收率在第二轮达到了100%(表 2)。

表 2 专家函询问卷回收统计表/n, %
2.1.2 两轮专家的权威程度

专家的权威程度一般涵盖两个因素,一是指专家对研究内容和指标作出判断的依据,一个是专家对指标的熟悉度,两者最后共同合成专家的权威系数。[8]结果显示两轮函询专家对问卷的内容权威系数均在0.8以上,权威性很高(表 3)。同时,两轮专家的权威程度各指标结果非常接近,说明专家于两轮指标判断的权威程度均较高,也显现出专家对第一轮和第二轮函询指标判断的一致性较高。[8-9]

表 3 两轮函询的专家权威程度统计表
2.1.3 协调系数

协调系数是体现专家协调度的指标之一,和变异系数一起反映专家对所有及单个指标评价的协调程度。协调系数w在0~1之间,w越大,表示专家的协调程度越好,反之意味着专家意见协调程度较低。表 5是用SPSS23.0进行的两轮协调系数显著性检验的结果。两轮专家组的意见非偶然协调的概率很大,在95%的置信度下,P < 0.001,说明两轮专家意见在非偶然协调方面可行。[8-9]同时,第二轮专家的协调系数和第一轮相比均有一定提高,表明专家对指标重要性的认识越来越趋向一致,可信度较第一轮增高,且结果可取(表 4)。

表 4 两轮专家协调系数统计表

表 5 函询专家基本情况
2.1.4 专家对测评指标的筛选及权重结果

对两轮回收的70份问卷进行统计,专家对驱动力和制约力两部分的指标体系分别进行了判断,专家意见集中度用重要性的平均分值(Mj)、满分率(Kj)表示,专家意见的协调程度用变异系数(CV)和协调系数(W)表示。本研究采用“界值法”进行指标筛选:根据每项指标的重要性得分计算满分率、算术均数和变异系数。满分率和算术均数的界值为:均数-标准差,分值高于界值的指标入选; 变异系数的界值为:均数+标准差,得分低于界值的指标入选。参照以上三个衡量尺度均不合要求的指标才被剔除,以防止重要指标丢失。[8-10]

经过两轮的专家函询及指标筛选,新增驱动力三级指标1项,合并制约力三级指标1项,在原有指标上进行修改、补充和融入二级指标1项、三级指标6项,变革力测评指标体系最终得以确立。该分析框架共分为两部分,即驱动力部分和制约力部分,共包含指标84项,其中一级指标10项,二级指标26项,三级指标48项。同时,本指标体系框架来源于力场模型和政策任务,结构层次分明,故根据专家的赋分形成了不同级别指标的权重。

① 限于篇幅原因,不再详细列出,有需求请联系本文作者。

2.2 函询专家的专业权威度与代表性

本研究共有35位函询专家参加了两轮背靠背问卷咨询。这些专家覆盖了从政策制定到逐级执行的各层面的行政官员、主管部门行政人员以及一线的院长和从事政策理论研究的学者,其中各层级专家从事本专业年限超过10年的占60%,即亲历了新医改至今的所有历程。专职学者9人,还包括部委和省级医改办专家,超过半数为专家学者,因此,专家对改革政策的熟悉度和权威度均较高,代表性很强。尽管为保证各层级专家数量均衡,本研究选定的咨询专家较多,但经两轮咨询后,指标内容的协调性达到了较高一致的结果(表 5)。

2.3 经无量纲化处理形成综合评价体系

本研究根据不同类型指标的特点,采用了三种方法对测评指标进行标准处理,并对各项三级指标进行了评分细则确定:一是采用锚定分级法,对大部分的定性指标进行三级锚定。锚定标准依据33号文件的框架和相关评价指标最新的政策要求,按照执行到位为满分(强),大部分执行为75%得分(中),和少部分执行为50%得分(弱),使用“强、中、弱”三种评价标准加以等级性量化[11-13];二是采用文本分析法对主观性指标和指标中的主观部分进行量化处理。将半结构访谈内容按照院长、科主任和医护人员分类,提取关键词,统计消极要素频率和制约力大小[14-15];三是采用配对分析法对某一指标中包含的多个、多年度历史数据指标进行处理。如一个指标中包含药占比、检查占比和化验占比等多个、多年度指标数据,将表示每个指标的复合增速的4组数据列在一起,两两配对比较,其价值较高者可得1分,最后将各指标配对所得分数相加,其中分数最高者即等级最高者,按分数高低顺序将每个指标进行排序,即可划定每个指标等级。经过无量化处理,最终形成了双向的测评指标体系,即驱动力部分和制约力部分,分别以百分制按指标权重确定分值,结合每条指标的评分细则形成可操作性的综合评价体系。

2.4 指标体系的三角互证结论

应用本文建立的变革力测评指标体系对4个案例地区进行评价,获得了初步测评结果(表 6)。

表 6 案例地区综合评价得分结果

之后将变革力测评指标体系测评结果与其他来源的证据结果进行比对,判断是否能够形成三角互证。现从三种来源获得的评价结论进行比较以得出确切、可靠的评价结果(表 7),可见案例的初步印象及阶段性成果、社会评价和测评结果三个方面的证据结论非常接近,趋势一致。

表 7 多元证据结论间的比较
3 结论 3.1 改革驱动力和制约力的分解开辟了对执行政策进行评价的新视角

就政策执行理论而言,政策效果的显现需要较长一段时间,对政策执行结果的衡量可能需要10年甚至更长时间。[16]从33号文件顶层设计形成至今,按照政策文件要求应该落地实施了,但各地改革政策执行和改革推进的不平衡却依然存在,虽然评价政策中长期效果可能为时尚早,但寻找一种定量和可比的测评工具来分析政策执行过程中不平衡的原因是可能的。本研究在测评指标体系构建中体现了两处创新:一是评价的视角。本着33号文政策中性的原则,指标体系重点关注“政策执行过程”,则会得到驱动改革政策执行有力的发现,或者取得改革政策执行不力或失败的原因,并将信息反馈至改革政策决策阶段;二是采用了双向指标评价体系。可以动态对比改革过程中驱动力和制约力的对抗与转化,分析和预判改革地区县级公立医院综合改革的阶段,研究和解释改革如何消解来自于社会、组织和个人等多层面的变革阻力,使改革得以推进,是对推动县级公立医院综合改革评价工具开发的有益尝试。

3.2 指标体系构建兼顾内容效度和层次比较,可以找出问题的症结

本研究是要比较相同的顶层设计背景下为何各地政策执行和改革推进不平衡。而本文构建的二、三级指标均来源于被执行政策(2015年的33号文件),这使得政策执行的评价指标体系具有很好的内容效度,也保证了对各地政策执行评价尺度的一致性。同时,指标体系将政策内容从建立新机制的驱动力量和破除旧机制的制约力量两个方向上构建了相互对抗的双向指标框架,由此更深入地考量各地政策执行过程中驱动和阻碍改革的力量对比,寻找改革得以推进和推进不力的深层次原因存在于哪一维度,以及程度深浅。这就解释了为何有些地区面上政策执行较全面,驱动力很强,但改革推进的程度却不深,就在于其制约力也很强劲,未能很好地化解改革的阻力。因此,本研究指标体系构建的方法将改革政策执行与改革推进分层次可比。

3.3 无量纲化处理——测评指标体系可操作性

本研究初步构建的变革力测评指标体系,尚不具备实践价值,无法实现案例应用的横向可比。因此,对定性指标进行无量纲化处理就显得很有必要。本论文针对指标体系中的定性指标和定量指标进行不同方式的处理,对于来源于文献(包括文件)的客观指标,运用锚定评价法来区分程度;对于访谈获得的资料,运用文本分析法进行处理,以获得可供比较的关键词及频次;有量化数据的部分,运用配对比较法进行去量纲化处理。因此,本文构建的指标体系中原定性指标和定量指标均具备了可以量化评价的条件,即该指标体系可以凭借统一的量化标准去衡量、评价案例地区县级公立医院综合改革变革力的大小,并使不同案例地区的评价结果具有可比性。

3.4 指标体系通过三角互证的验证才有好的解释力和说服力

本研究采用了三角互证的方法来验证测评指标体系的有效性,即使用测评工具对多案例进行评价,并将测评结果与其他来源的证据结果进行比对,判断是否形成三角互证。测评结果是定量评价结果,与已有的社会评价和改革地区的一些数据指标结果进行比较,虽然不是指标体系构建必须的环节,但是不同证据结论间可以相互解释和佐证,使得理论研究与实践相对照、相结合。本评价指标体系的应用及研究发现将另文讨论。

3.5 指标体系研究的理论意义和深入拓展

本文构建变革力测评指标体系的思路与案例应用对于其他改革政策执行的评价,以及对城市公立医院综合改革的评价均具有一定的借鉴意义。首先,本文案例选择了国家试点和示范地区,今后,可进一步拓展评价的范围,甚至可选取一些极端案例进行比较,会对改革推进中问题的解决提供更多参考;同时,本测评指标体系是基于县级公立医院综合改革33号文件的研究,一是因为县级公立医院综合改革的顶层政策设计的路径与逻辑与城市公立医院综合改革的顶层政策设计高度一致。二是因为我国的县级公立医院数量、级别统一、隶属关系比较清晰,研究起来相对比较简单。三是研究需要由简向繁,县级公立医院综合改革变革力测评指标体系对于城市公立医院综合改革的研究将有重要的借鉴意义。因此,未来还可进一步对城市公立医院变革力测评指标体系进行开发研究,进一步拓展量表使用的范围。

致谢

感谢在测评指标体系构建过程中,35位专家学者所给予的专业、无私的支持与帮助!

作者声明本文无实际或潜在的利益冲突。

参考文献
[1]
赵楠, 陈娟. 社区卫生服务机构内部服务质量指标评价体系研究[J]. 中国卫生政策研究, 2015, 8(1): 37-42. DOI:10.3969/j.issn.1674-2982.2015.01.007
[2]
胡红濮, 刘硕, 陈荃, 等. 人口健康信息化评价指标体系构建研究[J]. 中国卫生政策研究, 2016, 9(12): 6-11. DOI:10.3969/j.issn.1674-2982.2016.12.002
[3]
Winter S. Opening Up the Black Box: Implementation and the Policy Process[M]. 1990.
[4]
谢立欣. 三角互证(Triangulation)研究方法在教育学研究中的应用[J]. 中国校外教育旬刊, 2013(7): 105.
[5]
Lewin K. Action Research and Minority Problems[J]. Journal of social Issues, 1946.
[6]
Lewin K. Group Decision and Social Change[M]. 1952.
[7]
lles and Sutherland and the Program Management Group by Service Delivery and Organisation (SDO) R & D Programme-Change Management Skills, NHS, 2004[Z].
[8]
王春枝, 斯琴. 德尔菲法中的数据统计处理方法及其应用研究[J]. 内蒙古财经学院学报(综合版), 2011, 9(4): 92-96. DOI:10.3969/j.issn.1672-5344.2011.04.022
[9]
费秀珍, 王虎峰. 我国助产士专业体系构建的质性研究[J]. 中华现代护理杂志, 2014, 49(19): 2318-2322. DOI:10.3760/j.issn.1674-2907.2014.19.003
[10]
刘伟涛, 顾鸿, 李春洪. 基于德尔菲法的专家评估方法[J]. 计算机工程, 2011(S1): 189-191.
[11]
张灵. 行为锚定等级评价法在高校实验技术人员工作业绩考核中的运用[J]. 逻辑学研究, 2007, 27(8): 131-133. DOI:10.3969/j.issn.1674-3202.2007.08.031
[12]
胡瑞, 唐文熙, 张研, 等. 基于行为等级锚定法的我国县乡两级医生纵向协作研究[J]. 中国卫生事业管理, 2015, 32(8): 599-602.
[13]
杨梅. 基于行为锚定评价法的考核指标体系构建与实践[J]. 中国卫生质量管理, 2013, 20(5): 91-94. DOI:10.3969/j.issn.1006-7515.2013.05.031
[14]
李宇飞, 王虎峰, 李颖, 等. 患者视角下北京市某区基层首诊制影响因素质性研究[J]. 中国医院管理, 2016, 36(2): 4-6.
[15]
邓雪琳. 改革开放以来中国政府职能转变的测量——基于国务院政府工作报告(1978-2015)的文本分析[J]. 中国行政管理, 2015(8): 30-36.
[16]
定明捷. 中国政策执行研究的回顾与反思(1987-2013)[J]. 甘肃行政学院学报, 2014(1): 17-28. DOI:10.3969/j.issn.1009-4997.2014.01.002
[收稿日期: 2019-01-02 修回日期: 2019-04-01]
(编辑  赵晓娟)