2. 武汉大学全球健康研究中心 湖北武汉 430072;
3. 中国医学科学院卫生政策与管理研究中心 北京 100020
2. Global Health Institute, Wuhan University, Wuhan Hubei 430072, China;
3. Center for Health Policy and Management, Chinese Academy of Medical Sciences, Beijing 100020, China
2017年7月, 国务院办公厅发布《关于建立现代医院管理制度的指导意见》(国办发〔2017〕67号), 提出“到2020年基本建立权责清晰、管理科学、治理完善、运行高效、监督有力的现代医院管理制度”。[1]这为研究者提出了一个命题:现代医院“管理科学、运行高效”的衡量标准是什么?可以定量测量“医院内部管理水平”和“医院运营效率”吗?
从国外情况来看, 2002年Bloom和Reenen研发旨在定量测量企业和组织内部管理水平的世界管理调查(World Management Survey, WMS)项目, 收集美国、英国、德国和法国的700多个管理实践数据点并发表了研究结果[2];2008年将应用范围扩大到了学校和医院, 形成WMS医院版(WMS-H)。WMS-H包含20个基本管理实践问题, 从1分(最差)到5分(最好), 增量为1分, 并逐渐发展成为分析医院管理水平“软实力”的有力工具[3]。但是随后一些研究显示, 发展中国家的学校和医院在很多管理领域存在明显的左尾现象[4-5], 即原有评分等级在1~3分之间区分度不够高。因此, 2016年Lemos和Scur基于WMS开发了适用于发展中国家公共部门的扩展调查工具(Development WMS, D-WMS), 加入了1.5分和2.5分两个选项, 并在原20个管理实践问题的基础上分别给学校和医院增加了3个和1个领导实践问题[6], 在医院管理方面形成了医院版调查表(D-WMS-H)。
从国内情况看, 2013年北京大学国家发展研究院中国卫生经济研究中心等[7-9]将此工具引入国内, 研制了《中国医院管理调查表》(Chinese Hospital Management Survey, CHMS), 通过电话访谈方式进行预试验和正式调查, 对调查问卷的信度、效度进行检验, 并在一定范围内测量了中国医院的管理水平。但目前国内尚未见将D-WMS-H引入中国进行适应性分析和医院管理水平测量的研究。由于D-WMS-H评分更为精确, 更适合医院环境的应用[6], 因此有必要紧跟WMS发展的步伐, 研究将D-WMS-H引入我国开展医院内部管理水平测量的适应性并进行定量测量, 以便于通过国际比较评判我国公立医院内部管理水平。
基于上述背景, 本课题组参照D-WMS-H翻译、修订形成了《中国医院管理调查表-扩展版》(Development Chinese Hospital Management Survey, D-CHMS)。在此基础上, 本研究首先通过开展预调查检验调查表的信度和效度, 分析其在国内的适宜性、可行性和可操作性;其次与国内同类研究进行方法学比较, 提出改善的意见和建议, 最后与国内外其他同类研究进行比较实证测量结果, 为定量评估中国医院内部管理水平提供新的证据。
1 资料与方法 1.1 调查表的翻译修订通过世界管理调查官方网站获取《世界管理调查(医院版)》发展中国家扩展调查工具(Development WMS-H, D-WMS-H), 翻译并修订使其符合中国公立医院实际情况, 形成本地化版的《中国医院管理调查表—扩展版》, 简称D-CHMS调查表。
1.2 研究样本的选择以二级以上公立综合医院为研究对象, 采取系统分层抽样方法, 结合现场调查的可行性和调查成本确定研究样本。按照2018年全国各省市区人均GDP排名[10], 采取三分位法在前、中、后部分各选取2个省份作为研究样本, 样本省份确定山东、湖北、海南、四川、安徽、山西。在每个省份中选取委属、省属三级甲等综合医院1~2家, 地市属三级甲等综合医院2~3家;在选中的每个地市中抽取区、县属二级甲等综合医院2家。按此抽样方案确定样本医院共63家, 其中三级甲等综合医院36家, 二级甲等综合医院27家。
1.3 医院管理水平测量本研究采取现场访谈的方式测量医院管理水平。课题组在每家被调查医院召开现场访谈会, 邀请样本医院访谈对象约10人参与访谈, 每家医院包括院级领导1人, 医务、护理、人事、财务、质管、运营等部门负责人各1人, 心内、骨科和妇产科主任(或副主任)各1人(英文调查表选择医院较大科室的主任作为访谈对象, 本调查与其保持一致)。访谈者包含3名研究人员和1名记录人员, 1名研究人员主持访谈, 根据D-CHMS调查表内容进行提问并打分, 另外2名研究人员根据医院相关人员回答调查问卷问题的情况分别进行同步打分;1名记录员专职记录访谈内容;访谈会结束后3名研究人员集中汇总讨论根据每个研究人员的打分情况进行综合评判, 给出样本医院每个条目的分数。
1.4 信度和效度分析由于本问卷采用多重计分方式, 分为多个等级, 故使用Cronbach's alpha信度系数法来测量问卷内部一致性信度。采用统计分析法对调查表进行内容效度分析, 采用因子分析法进行结构效度分析, 数据处理和分析应用SPSS23.0完成。
2 研究结果 2.1 调查表主要内容表 1是依据D-WMS-H翻译和修订后形成的本地化版的D-CHMS调查表主要内容, 共有5个一级维度, 21个二级维度, 63个三级维度。
21个二级维度的Cronbach's alpha系数为0.932, 63个三级维度的Cronbach's alpha系数为0.948。Cronbach's alpha系数均在0.9以上, 可以认为D-CHMS调查表的信度较好。[11]
2.2.2 效度21个二级维度得分与调查表总分的相关系数的显著性P值均小于0.01, 可以认为调查表的内容效度有效。调查表KMO值为0.840, Bartlett's Test显著性小于0.05, 说明该资料适合进行因子分析。[12]按照基于主成分分析法、特征值大于1的原则, 共提取出5个公因子, 这5个公因子的方差贡献率分别为20.957%、14.051%、13.693%、11.348%、8.535%, 累积贡献率达68.583%(表 2)。
表 3为利用最大方差法对初始载荷矩阵进行旋转得到的旋转后的矩阵, 因子分析提取出5个公因子。采用回归法得到因子得分系数矩阵, 根据该矩阵进一步计算出63家样本医院因子得分, 表达式如下:
其中, aij表示第j个指标在第i个公因子上的得分系数。根据各因子得分加权计算综合得分, 权重取各公因子的方差贡献率占累计贡献率的比重, 计算公式为:
因子分析结果显示全部21个问题均被纳入, 共提取5个公因子:
第一公因子F1在绩效审核、人力资源有效利用、标准化诊疗、目标的关联性、医院布局、提拔高绩效员工、绩效追踪、目标的明确性和可比性、流程管理动机、奖励绩优者这10项指标上载荷系数较大, 这10项指标中标准化诊疗、医院布局和流程管理动机主要体现的是医院流程管理方面, 人力资源有效利用、提拔高绩效员工、奖励绩优者、绩效审核、绩效追踪、目标的关联性以及目标的明确性和可比性等指标主要是对医院人力资源岗位、分配制度等基本制度的反映, 因此将F1命名为标准化流程因子, 该因子对全部初始变量的方差贡献率为20.96%。
第二公因子F2在绩效讨论、目标时限、目标平衡、调离表现不佳者这4项指标上载荷系数较大, 这4项指标主要是对于医院目标管理的衡量和反映, 因此将F2命名为目标管理因子, 该因子对全部初始变量的方差贡献率为14.05%。
第三公因子F3在管理人才、吸引人才、目标难度这3项指标上载荷系数较大, 这3项指标主要体现了医院人才管理方面, 因此将F3命名为人才管理因子, 该因子对全部初始变量的方差贡献率为13.69%。
第四公因子F4在结果管理、持续改进这2项指标上载荷系数较大, 这2项指标可以看作是对管理绩效持续改进结果的衡量和体现, 因此将F4命名为绩效改进因子, 该因子对全部初始变量的方差贡献率为11.35%。
第五公因子F5在医生问责机制、留住人才这2项指标上载荷系数较大, 这2项指标反映了对医生在服务质量和成本控制方面的问责管理, 因此可将F5命名为医生问责因子, 该因子对全部初始变量的方差贡献率为8.54%。
2.3 医院内部管理水平测量结果在D-WMS调查工具中, 1~2分是指组织在管理的某个方面几乎没有或非常薄弱地实行了结构化管理;2~3分是指组织建立了一些非正式的管理, 但这些管理大部分是一种被动管理;3~4分是指组织建立了正式的、良好的过程管理(尽管还不够成熟), 但大部分采取了主动管理方式;4~5分是指组织有良好的管理并且通常被视为该行业的最佳管理实践。
表 4是根据现场访谈结果计算得出的样本医院内部管理水平得分情况。样本医院内部管理水平平均得分为2.97, 其中:三级甲等医院平均得分3.09, 二级甲等医院平均得分2.82。结果表明:我国三甲医院基本上建立了正式的、良好的过程管理(尽管还不够成熟), 但大部分采取了主动管理方式;二甲医院总体上建立了一些非正式的管理, 但这些管理大部分是一种被动的管理。
总体上看, 我国公立医院在Q4、Q3、Q19、Q11、Q16五个维度得分较高, 表明我国医院在持续改进、标准化诊疗、管理人才、目标关联性、奖励绩优者方面管理水平相对较好;在Q20、Q7、Q1、Q6、Q9五个维度得分较低, 表明我国医院在留住人才、绩效审核、医院布局、绩效追踪、结果管理方面管理水平亟待提升;在Q20、Q7、Q9、Q14、Q2五个维度得分离散程度较小, 表明医院在留住人才、绩效审核、结果管理、医生问责机制、流程管理动机方面管理水平具有一定的同质性;在Q19、Q17、Q4、Q21、Q3五个维度得分离散程度较大, 表明医院在管理人才、调离表现不佳者、持续改进、吸引人才、标准化诊疗方面管理水平差异较大。
三级医院在Q4、Q19、Q3、Q12、Q16五个维度得分较高, 表明医院在持续改进、管理人才、标准化诊疗、目标时限、奖励绩优者方面管理水平相对较好;在Q20、Q7、Q6、Q1、Q9五个维度得分较低, 表明医院在留住人才、绩效审核、绩效追踪、医院布局、结果管理方面管理水平有待提升;在Q20、Q7、Q9、Q14、Q2五个维度得分离散程度较小, 表明医院在留住人才、绩效审核、结果管理、医生问责机制、流程管理动机方面管理水平相当;在Q19、Q3、Q12、Q21、Q16五个维度得分离散程度较大, 表明医院在管理人才、标准化诊疗、目标时限、吸引人才、奖励绩优者方面管理水平差异明显。
二级医院在Q4、Q11、Q18、Q3、Q5五个维度得分较高, 表明医院在持续改进、目标的关联性、提拔高绩效员工、标准化诊疗、人力资源有效利用方面管理水平相对较好;在Q20、Q7、Q21、Q19、Q1五个维度得分较低, 表明医院在留住人才、绩效审核、吸引人才、管理人才、医院布局方面管理水平较低;在Q9、Q20、Q7、Q13、Q10五个维度得分离散程度较小, 表明医院在结果管理、留住人才、绩效审核、目标难度、目标平衡方面管理水平具有相似性;在Q19、Q17、Q1、Q11、Q6五个维度得分离散程度较大, 表明医院在管理人才、调离表现不佳者、医院布局、目标的关联性、绩效追踪方面管理水平参差不齐。
3 讨论目前关于医院管理水平的定性分析和案例研究较多, 但是能够通过量化方式对医院内部管理水平进行评估的研究方法和量表极少。随着世界管理调查工具WMS-H医院版被引入中国, 越来越多的研究者将其应用于医院内部管理水平测量, 但D-WMS-H调查表尚未被引入中国。因此本研究首次将D-WMS-H调查表引入中国, 分析其应用于我国医院管理水平调查的可行性, 并将我国医院管理水平与全球医院管理水平放在同等指标系下进行比较分析, 为促进我国医院管理水平的测量提供新的研究证据。
3.1 D-CHMS调查表具有较好信度和效度信度、效度是所有测量工具不可或缺的条件。[11]如果信度系数在0.8以上, 则可认为调查表有较高的内在一致性。[12]D-CHMS调查表的Cronbach's alpha系数大于0.9, 表示该问卷具有很好的内部一致性。与崔宇杰[8]等人研制的CHMS调查工具研究结果一致, 表明不同版本的世界管理调查表均具有较高的内部一致性。
D-CHMS调查表的KMO值为0.840, Bartlett球形检验的χ2值为791.196(P < 0.001), 说明样本数据适合做因子分析。在主成分分析法和特征值大于1的原则下, 共提取出5个公因子并清晰命名, 累积方差贡献率达68.583%, 一般认为量表的累计方差贡献率大于60%则量表的结构效度较好。[13]本研究提取的前4个公共因子与原WMS-H设计的结构维度基本一致。F2目标管理因子、F3人才管理因子与原WMS-H的一级维度一致, F1标准化流程因子包含了原WMS-H中标准化服务与运营和绩效管理两项一级维度的大部分内容, 仅原绩效管理维度里面的两项二级维度形成了F4绩效改进因子。特别是提取的第5个公共因子医生问责因子, 准确反映了D-WMS-H新增的第21个维度(医生问责方面)的管理实践内容。
崔宇杰等人的研究结果表明, 以WMS-H为基础的CHMS调查工具具有较好的信度和效度。[8]与其研究结果类似, 以D-WMS-H为基础的D-CHMS也具有较高的内部一致性和较好的结构效度, 表明该调查工具可以应用于中国公立医院内部管理水平调查。
3.2 同类研究调查方法比较从同类研究使用的调查表类型来看(表 5), 以前的研究均使用以WMS-H为基础的汉化版或修订版本, 而本研究调查工具是以最新D-WMS-H为基础的汉化版本, 使我国医院管理水平定量研究紧跟国际相关领域, 测量结果可以与国际同一量表研究结果进行比较分析。
其次, 从同类研究抽样样本来看, 前四项研究均未采用系统抽样方法, 本研究采取系统分层抽样方法, 选取了6个省份63家医院作为调查样本, 其中三甲综合医院36家, 二甲综合医院27家。抽样具有一定的系统性和代表性。但与研究2、研究3相比, 本研究样本量较小。主要原因是考虑到本研究是一项关于D-WMS-H的预调查, 抽样样本63家尚可接受。与同为预调查的研究1相比, 本研究抽样样本量是其样本量的3倍多。
再次, 从调查方式来看, 研究1~3采取电话访谈方式, 研究4采取自填问卷方式, 本研究采取现场调查和访谈方式。采取该种方法的优点有:一是现场访谈可通过观察医院直观感受医院的管理现状和水平;二是医院参与专题小组讨论的成员比较广泛(平均10人), 可以全面深入地介绍医院相关管理情况, 而电话访谈等方式因被访谈对象工作范围局限容易产生相关管理问题盲点或者凭主观感受回答等情况;三是有利于形成回答问题的诚信压力机制, 被访谈人员作不实回答的可能性较低, 保证了答案的真实性;四是对于有疑问的回答, 可以现场要求医院提供关键材料作为支持证据, 有利于获取准确真实的回答。五是现场访谈时间平均长达90分钟, 比电话访谈等方式长一倍多, 使调查更为详细。
最后, 从评分方式来看, 本研究采取3名研究者同时评分, 在出现评分差异时, 大多数情况下可采取平均分或少数服从多数的原则确定分数。而其他电话访谈研究仅有2名评分者, 在出现评分差异时, 难以根据合理的规则确定最终分数, 或者说评分效率偏低且不够合理。
本研究采用的现场访谈是近年来WMS相关研究采用并推荐的调查方法[6], 但此方法也存在调查费用较高、时间成本较大、不能实现双盲调查等不足之处。
3.3 同类研究中国医院管理水平得分比较从表 5可知, 关于中国医院管理水平的得分, 不同研究具有一定的差异性。除本研究之外的其他研究平均得分在2.51~2.86之间, 本研究样本医院平均得分为2.97分, 略高于同类研究。导致这种结果的原因可能有两个方面:
一方面是本研究结果高估了中国医院管理水平, 其原因包括:一是本研究作为一项国际量表的本地化调查, 样本量不够大, 存在抽样误差, 在后续研究中需进一步扩大样本量;二是本研究抽取的都是三甲或二甲公立综合医院, 不包括乙等或未定等级医院, 虽然样本医院得分较高, 但不能推断综合医院总体管理水平得分;三是本研究开展调查时间晚于前述研究, 例如本研究较北京大学的研究相差6年, 而随着时间的发展, 中国医院管理水平在持续提升, 因此出现这种差异。
另一方面是其他类似研究低估了我国医院管理水平。例如其他研究最高得分为2.86分, 而本文前述内容:2~3分是指组织建立了一些非正式的管理, 但这些管理大部分是一种被动的管理。1989年我国开展医院评审工作以来, 特别是2011版医院评审标准实施后, 我国绝大多数三甲和二甲医院内部管理基本已经建成正式的管理体系, 并主动开展医院各方面的管理。因此其他研究最高2.86分的评分可能低估了我国公立医院管理水平。另外基于前述讨论, 其他类似研究在抽样方法、调查方式、评分方式等方面亦需要优化。与其他研究相比, 本研究采用D-WMS-H中推荐的面对面现场访谈方式能更详细、精确的获取相关管理信息, 同时将访谈对象扩大到院领导、各相关行政科室负责人、临床科室主任等, 全方位调查样本医院管理实践情况, 有利于获取真实的管理得分。
3.4 中国医院管理水平得分国际比较2013年Bloom[15]等人利用世界管理调查工具对1 971家拥有心脏科和骨科的急诊医院进行分析, 其中:巴西289家, 加拿大175家, 法国158家, 德国130家, 印度493家, 意大利166家, 瑞典56家, 英国184家, 美国327家, 结果显示美国的平均管理得分为3.0分, 英国为2.8分, 瑞典2.7分。本研究结果表明, 我国公立医院内部管理水平平均得分为2.97分, 其中三级甲等医院平均得分3.09分, 二级甲等医院平均得分2.82分。上述结果表明:我国三甲医院平均得分与6年前的美国医院平均管理水平相当;二甲医院平均得分与6年前的英国医院平均管理水平相当。由此可以初步推断, 中国医院整体管理水平与世界主要发达国家还有一些差距, 特别是与文献显示最高水平的美国相比还存在较大的进步空间。
3.5 研究局限与展望一方面抽样方法有待改进, 今后的研究中应改进采取严格的分层随机抽样确定样本省份、不同层级、不同等级公立医院。另一方面相较于中国公立医院数量, 本研究样本数量较小, 下一步宜进一步优化和改进调查方式, 在确保调查质量的同时提升调查效率, 以便开展大范围的中国公立医院内部管理水平调查研究。
4 结论本研究形成三点主要研究结论:首先, 基于世界管理调查工具扩展版(D-WMS-H)研制的D-CHMS调查工具, 具有较好的信度和效度, 可以应用于我国医院内部管理水平的测量。其次, 宜采取基于现场调查的专题小组访谈开展我国医院管理水平的调查, 不推荐使用电话访谈等非现场方法, 可能低估中国医院管理的真实水平。最后, 中国三级甲等综合医院基本上建立了系统性的主动式管理, 而二级甲等医院尚存在非系统性的被动式管理, 我国公立医院整体管理水平与世界主要发达国家尚有一定差距, 具备较大提升空间。
作者声明本文无实际或潜在的利益冲突。
[1] |
国务院办公厅.关于建立现代医院管理制度的指导意见[EB/OL].(2017-01-25)[2019-07-21]. http://www.gov.cn/xinwen/2017-07/25/content_5213309.htm
|
[2] |
Bloom N, Reenen J V. Measuring and explaining management practices across firms and countries[J]. The Quarterly Journal of Economics, 2007, 122(4): 1351-1408. |
[3] |
Bloom N, Lemos R, Sadun R, et al. The New Empirical Economics of Management[C]. National Bureau of Economic Research, 2014.
|
[4] |
Lemos R, Scur D. Could Poor Management be Holding Back Development?Describing Practices in the Public and Private Sectors in India[C]. International Growth Centre, 2012.
|
[5] |
Bloom N, Lemos R, Sadun R, et al. Does management matter in schools?[C]. National Bureau of Economic Research, 2014.
|
[6] |
Lemos R, Scur D. Developing Management: An expanded evaluation tool for developing countries[C]. Research on Improving Systems of Education, 2016.
|
[7] |
Peking University. Global Health Management Survey-China[R]. Management in Healthcare Report, 2014.
|
[8] |
崔宇杰, 赵汗青, 刘国恩, 等. 可跨国比较的中国医院管理调查体系的构建研究[J]. 中国卫生政策研究, 2018, 11(6): 1-7. |
[9] |
赵汗青, 崔宇杰, 刘庭芳, 等. 基于世界管理调查方法的中国医院管理水平实证研究[J]. 中华医院管理杂志, 2018, 34(11): 955-960. |
[10] |
国家统计局.国家数据[EB/OL].(2019-08-02)[2019-08-02]. http://data.stats.gov.cn/easyquery.htm?cn=E0103
|
[11] |
荣泰生. SPSS与研究方法[M]. 大连: 东北财经大学出版社, 2012.
|
[12] |
张文彤. 世界优秀统计工具SPSS11.0统计分析教程(高级篇)[M]. 京: 北京希望电子出版社, 2002.
|
[13] |
张文彤, 董伟. SPSS统计分析高级教程[M]. 北京: 高等教育出版社, 2013.
|
[14] |
Zhu Y, Guo R, Dou L, et al. Development and evaluation of a hospital management practice rating scale[J]. Journal of Hospital Administration, 2018, 7(1): 9-17. |
[15] |
Bloom N, Sadun R, Reenen JV. Does Management Matter in Healthcare?[EB/OL].[2019-08-02].http://www.people.hbs.edu/rsadun/Management_Healthcare_June2014.pdf
|
(编辑 薛 云)