中国卫生政策研究  2018, Vol. 11 Issue (1): 76-83   PDF    
ARIMA模型、BP神经网络及其组合模型在卫生政策评估中的实证比较:以公立医院价格改革为例
马爱霞, 谢静, 唐文熙
中国药科大学国际医药商学院 江苏南京 211198
摘要[目的] 探索不同反向事实构建方法对医院财务数据预测的效率,以期对政策进行更有效的评估。[方法] 借助R软件,用南京市公立医院A在2011-2016年的药品收入、医疗服务收入建立测试数据集,分别用ARIMA模型、BP神经网络、ARIMA+BP组合模型进行预测并与实际拟合,并比较改革前后补偿率。[结果] 三个模型对药品收入的均方根误差分别为692.82、501.44、380.80,医疗服务收入的均方根误差分别为184.04、215.63、168.65,组合模型预测效率更高。用组合模型计算改革后A医院药品收入净损失为12 044.03万元,医疗服务收入净增长为18 532.60万元,为药品收入损失的153.87%。[结论] 医院财务数据因其线性与非线性的组合特征,使用组合预测模型的预测效果最佳。但在实际应用中,ARIMA模型操作简单,与组合模型预测趋势也较为一致,在实际卫生政策评估中也推荐使用。
关键词ARIMA模型     BP神经网络     组合模型     药品收入     医疗服务收入     政策评价    
A comparison of ARIMA Model, BP Neural Network Model and combined model in health policy evaluation: An empirical study of public hospitals pricing reform
MA Ai-xia, XIE Jing, TANG Wen-xi
School of International Pharmaceutical Business, China Pharmaceutical University, Nanjing Jiangsu 211198, China
Abstract: [Objective] To study the effectiveness of different time series models in the prediction of financial data in public hospitals, with the aim of obtaining a more reliable counterfactual in health policy evaluation. [Methods] ARIMA model, BP neural network and their combination were used for the estimation and prediction of drug revenue and medical service revenue based on a dataset for the period from November, 2011 to October, 2016 for hospital X before and after Nanjing medical pricing reform. Root mean square error (RMSE) was used to estimate the model accuracy. [Results] RMSE of drug revenue from the three models were 692.82, 501.44 and 380.80, and of medical service were 184.04, 215.63 and 168.65. The findings shows that the combination model was proved to be the most efficient one among the three. The combined model was used to calculate the net loss of drug revenue which was estimated to be 120, 440 million, and the net increase of medical service was estimated to be 185, 326 million after the reform, which was 1.539 times of the drug loss. [Conclusions] The revenue data of public hospitals are usually complex with a both linear and non-linear trend. The combination model of ARIMA and BP neural network could solve the problem for once with an acceptable accuracy. However, ARIMA model is simpler to operate as compared to other two models, and also more consistent with the forecasting trend, therefore ARIMA is also recommended in the evaluation for health policies.
Key words: ARIMA model     BP neural network     Combined model     Drug revenue     Medical service revenue     Policy evaluation    

城市公立医院医药价格综合改革后,由于取消药品加成、提高医疗服务价格,医院药品收入与医疗服务收入将会受到影响,其中医疗服务收入的改变更是直接反映了改革取得的效果。一般来说,随着社会经济的发展,医疗服务收入本身呈增长趋势,因此在评价政策效果时,应该剔除数据本身存在的规律,即构造“反事实”——通过自身历史数据构建其发展趋势并用以预测“非改革”状态下数据的表现情况。医院收支数据多为时间序列,常用的预测模型有线性时间序列模型、ARIMA模型(Autoregressive Integrated Moving Average Model)、BP(Back Propagation)神经网络模型等。[1-3]本文选用ARIMA模型、BP神经网络模型以及ARIMA+BP组合模型,探讨其预测效率,以期为政策评价中反事实的构造提供方法学参考。

1 模型简介 1.1 ARIMA模型

ARIMA模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving Average Model),是时间序列模型最常用的参数模型之一,由Box和Jenkins于20世纪70年代初提出。[4]模型运算过程为:先将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归。ARIMA模型由于在逼近许多平稳过程时具有较高的适应性,因此常用于线性预测。模型完整形式为ARIMA(p, d, q),其中AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。平稳化后预测公式如下所示:

(1)

针对许多时间序列数据波动具有季节规律性,可将ARIMA模型扩展为季节时间序列模型(Seasonal ARIMA Model,SARIMA),即本研究采用的模型。SARIMA模型采用季节差分的方法去掉季节性,可解决ARIMA模型无法解决的季节性问题。季节性建模处理与ARIMA模型类似。模型完整形式为SARIMA(p, d, q)(P, D, Q)s,公式表达式如下所示:

(2)

其中,P为季节自回归阶数,Q为季节移动平均阶数,s为周期,φp LsΘQ Ls分别为季节P阶自回归算子和Q阶移动平均算子。Εt服从均值为0方差为σ2的正态分布。建立SARIMA模型,应首先对季节性因素进行处理,用观察法或统计检验确定季节性后,对时间序列进行季节平稳性检验,然后识别SARIMA模型,确定PDQpdq的取值,随后进行参数估计与模型检验,得到初步模型后便可使用SARIMA模型进行时间序列的仿真与分析。

1.2 BP神经网络模型

BP(Back Propagation)神经网络,即误差反向传播模型,由信息的正向传播和误差的反向传播两个过程组成,是一种最为常见且较为复杂的神经网络模型。[5]BP神经网络是一个三层或以上的网络,不仅包含输入层和输出层,而且还有一层或多层隐层(图 1)。X=(X1, X2, …, Xn)即为BP神经网络的输入向量,b=(b1, b2, …, bt)是隐含层的输出向量,Y是输出层的输出向量,WihWhj是BP神经网络的网络权值。

图 1 三层BP神经网络结构图

此时节点的输出模型为:

(3)
(4)

式(3)是隐含层节点的模型,其中f1为激活函数,一般取输出值在(0, 1)之间的Sigmoid函数。式(4)是输出层节点的模型,其中f2为激活函数,通常为线性函数。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐藏层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。

BP神经网络模型对单变量的时间序列也可进行预测。以某一时间序列X1, X2, …, Xn为例,预测时则认为预测值与前面m个值之间存在某种函数关系,构建Xt=F Xt-1, Xt-2, …, Xt-m+1函数关系。即将预测值Xt当为输出变量Y,该值前面的m个值Xt-1, Xt-2, …, Xt-m+1作为输入向量X,利用BP神经网络来推导未来值。近年来随着人工智能的不断发展,BP神经网络已经成为预测非线性时间序列的主流模型之一。

为解决时间序列的季节性波动问题,从一般的BP神经网络发展出了季节性神经网络模型。设一时间序列X= X1X2, …,Xn是以s为周期的季节性时间序列,根据季节性ARIMA模型理论,认为未来的一个序列Xt值是和历史d×s个值之间存在某种函数关系,函数关系为Xt=F Xt-1, Xt-2, …, Xt-d×s+1,用三层神经网络(图 1)拟合该周期函数,来预测未来的Xt值。

1.3 ARIMA+BP组合模型

组合预测模型的思想最早在1969年由Bates等提出,Bates等多位研究学者均指出并验证了单项预测模型的有效组合可以显著地提高预测效果。[6]将ARIMA与BP预测模型进行组合,能够结合ARIMA与BP模型的优势,分别提取研究数据的线性和非线性变化特征。[7]目前使用最广泛的是线性组合预测模型,一般的线性组合预测模型在时间序列应用时表达式如下:

其中yt为组合模型的预测结果, yt1yt2分别为ARIMABP模型预测模型t期的预测值,w1w2为相应的组合权重。组合模型的难点在于最优组合权重的确定。若权重不合理, 则有可能出现组合模型的预测效果比单项模型差的情形。目前,确定权重的方法中被大多学者认可并采用的为数学优化方法,即通过求误差平方和的最小值来确定最优的权重系数。假设ARIMABP模型、组合模型的预测误差分别为e1te2tet,欲使组合模型误差平方和E=∑ei2最小,则有:

w2用1-w1代入可以得到:

组合模型误差平方和为:

通过计算E的最小值,即可得此时w1w2的值(即最优权重)。

2 资料与方法 2.1 资料来源

本研究从南京市城市公立医院医药价格综合改革中选取代表性医院A,并选取药品收入、医疗服务收入两个指标进行预测。A医院为三级甲等医院,改革前后药占比分别为40.91%和36.09%,医疗服务收入占比分别为16.63%和20.92%,在57所参改医院中属于中等,且规模适当、管理规范,因此较有代表性。

2.2 研究方法

鉴于南京价改于2015年10月31日零点正式开始,样本区间设定为2011年11月—2016年10月。按月收集改革前4年及改革后1年的数据,以改革前3年(2011年11月—2014年10月)的数据为训练数据,以改革前1年(2014年11月—2015年10月)为测试数据,分别运用ARIMA模型、BP神经网络及其组合模型对指标进行预测,并与未构造反事实情况下的指标表现水平进行比较。数据分析过程在R软件中实现。

3 结果 3.1 药品收入预测比较

建模前对原始数据进行预处理,拟分析的数据形态如图 2所示。可见,数据有一定的上升趋势,同时又伴随有周期性约为12个月的季节性波动,符合医院药品月收入现实意义。

图 2 药品收入原始数据

SARIMA模型:在R软件中先调用ts()函数将原始数据转化为波动周期为12的季节性时间序列,后运用auto.arima()函数,判断通过一次差分和季节差分后数据转化为一个平稳时间序列,再根据药品月收入时间序列一阶差分的自相关和偏自相关函数构建模型为ARIMA(0, 1, 1)×(1, 1, 0)12

BP神经网络模型:本研究釆用滞后项预测法,所构建神经网络模型的输入层节点数为12,输入的是待预测数据前的12个时间序列数据yt-1, yt-2, …, yt-12;输出层节点数为1,输出的是待预测数据yt。此外,隐含层的节点数通过经验法与试凑法确定为10,最终神经网络模型结构为12-10-1。隐含层的激活函数为log-sigmoid函数, 输出层激活函数为线性函数, 设定迭代次数为1 000次, 学习率为0.02, 误差目标为0.00001。考虑到本文的数据预测属于时间序列长期预测,因此采用迭代一步预测的方法。

组合模型:借助软件计算得到ARIMA模型权重w1=0.3895,BP模型权重w2=0.6105时,此时组合预测模型的误差平方和最小。

三种模型预测结果数值如表 1所示,选用均方根误差(RMSE)对预测效果进行评估。指标表达式如下:

表 1 三种模型对药品收入预测结果比较(万元)

表 1可看出组合模型的均方根误差最小,预测效果最为精准;三者的预测结果趋势如图 3所示,其中测试数据是指2014年11月—2015年10月测试数据的真实值,可以发现组合模型的拟合趋势与测试数据最为接近,也进一步说明了其预测效果的精准性。

图 3 药品收入预测结果
3.2 医疗服务收入预测比较

同理,对医疗服务收入进行测算。医疗服务收入=医疗收入—药品收入—卫材收入—检查收入—化验收入。组合模型的最优系数分别为:w1=0.6658;w2=0.3342。计算结果如表 2,发现组合模型预测的准确度最高。三个模型预测结果见图 4

表 2 三种模型对医疗服务收入预测结果比较(万元)

图 4 医疗服务收入预测结果趋势图
3.3 与实际值比较 3.3.1 改革对药品收入的影响

根据前文研究的结果,组合模型预测效果最优,但为了对比不同模型预测与组合模型预测的差值情况,本文分别采用组合模型、ARIMA模型以及BP模型对改革后A医院的药品收入进行反向事实数据预算。如图 5所示,三种模型预测趋势较为接近,并且发现改革后预测药品收入与实际药品收入相比有明显下降。

图 5 改革后药品收入损失情况

三种模型预测的反向事实数据如表 3所示,用改革后1年实际药品收入减去改革前1年实际药品收入,获得传统的改革药品收入损失量为403.95万元,由于药品收入自身具有上升的趋势,未剔除自身发展趋势,将导致药品收入损失预测降低。运用反向事实数据预测得到的改革后预测药品收入,利用改革后实际药品收入减去改革后预测药品收入,得到ARIMA、BP神经网络、组合模型三种模型预测的药品收入净损失量分别为14 180.53万元、10 680.94万元、12 044.03万元。相比于传统计算获得的药品收入损失,三种运用反向事实数据预测获得的净药品收入损失更贴近改革实际带来的净效应。

表 3 改革后药品收入反向事实数据的预测(万元)
3.3.2 改革对医疗服务收入的影响

同理,对医疗服务收入分别进行组合模型、ARIMA模型以及BP模型进行反向事实数据预算。如图 6所示,三种模型预测的趋势均较为接近,并且发现改革后实际医疗服务收入比预测医疗服务收入有明显上升。

图 6 改革后医疗服务收入增加情况

三种模型预测的反向事实数据如表 4所示,按照传统计算方式:改革后医疗服务收入—改革前医疗服务收入,获得医疗服务收入增加量为22 541.3万元,由于医疗服务收入自身具有上升的趋势,未剔除自身发展趋势,将导致医疗服务收入增加量预测加大。运用反向事实数据预测得到的改革后医疗服务收入净增加量,ARIMA、BP神经网络、组合模型三种模型预算的结果分别为18 172.25万元、19 250.51万元、18 532.60万元。相比于传统计算获得的医疗服务收入增加,三种运用反向事实数据预测获得的净医疗服务收入增加量更贴近改革实际带来的净效应。

表 4 改革后医疗服务收入反向事实数据的预测(万元)
3.3.3 医疗服务补偿率

医疗服务补偿率是指取消药品加成后,医院通过调整医疗服务价格获得的对药品差价补偿的比例。传统的医疗服务补偿率和剔除数据自身发展趋势以获得改革后的医疗服务净补偿率计算公式如下:

传统医疗服务补偿比=传统的改革医疗服务收入增加量/传统的改革药品收入损失量*100%

医疗服务收入净补偿比=改革后医疗服务收入净增加量/改革后药品收入净损失量*100%

根据表 3表 4分别计算出传统医疗服务补偿比、与运用反向事实3个模型测算的医疗服务补偿比(表 5)。可以发现,按照传统计算方式得到的结果与运用反向事实预测得到的结果相差较大,这是由于药品收入和医疗服务收入自身均具有上升的趋势,未剔除自身发展趋势,将导致药品收入损失预测降低、医疗服务收入增加量预测加大,因此计算出的医疗服务补偿率与实际情况偏差较大。观察剔除数据自身发展趋势后获得的医疗服务净补偿率,可以发现补偿率已经超过100%,证明改革后该医院增加的服务收入能够全额弥补甚至超出药品价格差额损失。

表 5 医疗服务补偿率
4 讨论 4.1 反向事实的重要性

从前文的分析中不难看出反向事实构建对医疗政策评价的准确度具有重要意义。现阶段,我们对医疗卫生政策的研究多采用对比改革前后观测指标的方法来衡量改革成效[8-9],但这种评价方法存在一定的局限性。其中最主要的问题是忽视了指标数据自身发展趋势(即反向事实数据)对效果评价的影响,在指标数据自身呈现正向或负向趋势时,这种忽视就直接导致了改革后观测指标的变化因素除了改革的影响外还包括了其自身客观发展的影响。具体而言,当指标数据具有正向发展趋势时,忽视反向事实数据将会导致评价机会成本下降、机会收益增加,同样,忽视具有反向发展趋势的反向事实数据则会导致评价机会成本上升、机会收益下降。因此,剔除数据自身发展趋势即将反向事实数据纳入评价体系对获得改革的净效应具有重要意义。运用反向事实评价公立医院价格综合改革成效将最大限度还原改革所获得的净效应。

4.2 组合模型捕捉线性和非线性效率更高

ARIMA模型与大多数时间序列预测方法一样,各变量之间的线性关系也是其主要预测前提之一[10],但实际研究中总是或多或少地含有非线性因素,当非线性因素影响较小,或在某一范围内影响较小时,尚可采用线性模型来描述或逼近。但非线性影响较大或用线性逼近也得不到较好结果的时候,非线性时间序列模型的运用就显露了其特有的优势。近年来神经网络模型的兴起为非线性模型预测提供了新思路。由于具备自动学习、逼近能够反映样本数据规律的最优函数,且当函数形式越复杂时,神经网络预测的效果越好[11],其在预测高复杂度的非线性时间序列方面明显优于传统的线性预测方法。

总结而言,ARIMA模型可对具有线性关系的数据进行时间序列预测,对非线性数据的处理不尽合理,且效果欠佳;BP神经网络可挖掘出数据中隐含的非线性关系,但由于不能反映时间序列的自相关和偏相关,在处理具有线性特征的数据时,其效果往往不如ARIMA。现实研究中,很多数据都是既包含线性信息,也包含非线性信息,单个的预测模型很难充分捕获时间序列中所包含的信息,而此时组合模型可以结合不同预测模型的优势,尽可能多的获取时间序列数据中的信息。

医院财务数据是医院医疗工作的经济基础、健康发展的基石,更是评价公立医院综合价格改革成效的重要依据。由于医院财务数据会受到各类因素波动的影响,如人口结构、疾病谱变化、季节性流行疾病、医生处方习惯、药品价格、服务价格等,均会导致医院财务数据具有复杂的线性与非线性组合特征,因此在用组合预测模型的预测效果最佳。

4.3 时间序列模型的局限性及选择建议

在实际操作时,BP神经网络模型隐含层层数和单元数的选择在理论上尚缺乏有力指导,一般是根据经验或反复实验进行确定,一定程度上增加了网络学习的负担。网络的学习和记忆还具有不稳定性,其对之前的权值和阈值缺乏记忆,在增加学习样本的情况下,网络需从头训练,故而BP及其组合模型的预测也会比较难。[12]ARIMA模型预测精度虽然没有组合模型预测的效果好,但预测的趋势与组合模型趋势也较为一致,且其操作性简单,实际应用性相对较强。

一般而言,在预测时间序列数据时,当数据长度越长,模型拟合预测效果也将越好,但本研究的时序数据仅限于十三五规划期间的数据,建议其他学者在有条件的基础上选取更长的数据进一步研究探索。

作者声明本文无实际或潜在的利益冲突。

参考文献
[1] 李望晨, 崔庆霞, 张利平. 基于趋势外推与ARIMA预测我国医院诊疗及住院人次[J]. 中国卫生统计, 2016, 33(3): 477–478.
[2] 侯福均, 吴祈宗. BP神经网络在铁路客运市场时间序列预测中的应用[J]. 运筹与管理, 2003, 12(4): 73–75.
[3] 翟静, 曹俊. 基于时间序列ARIMA与BP神经网络的组合预测模型[J]. 统计与决策, 2016(4): 29–32.
[4] 于爽, 郭祖超, 胡琳. ARIMA模型在医院季节性时序资料预测中的应用[J]. 数理统计与管理, 1991(6): 23–29.
[5] 杨娟丽, 徐梅, 王福林, 等. 基于BP神经网络的时间序列预测问题研究[J]. 数学的实践与认识, 2013, 43(4): 158–164.
[6] 梁德阳. 基于SARIMA和BP神经网络的时间序列组合预测模型研究[D]. 兰州: 兰州大学, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10730-1014304316.htm
[7] 张宇青, 易中懿, 周应恒. 一种线性ARIMA基础上的非线性BP神经网络修正组合方法在粮食产量预测中的运用[J]. 数学的实践与认识, 2013, 43(22): 135–142. DOI:10.3969/j.issn.1000-0984.2013.22.018
[8] 肖月, 赵琨, 李雪, 等. 东部某省县级公立医院医药价格改革评价[J]. 中国卫生政策研究, 2015, 8(1): 14–20.
[9] 陕西省价格协会陕西省物价局课题组. 城市公立医院补偿机制改革研究[J]. 价格理论与实践, 2016(10): 72–77.
[10] 叶明全. 基于神经网络的季节性时间序列预测方法研究[D]. 合肥: 合肥工业大学, 2004. http://d.wanfangdata.com.cn/Thesis/Y596647
[11] 钟颖, 汪秉文. 基于遗传算法的BP神经网络时间序列预测模型[J]. 系统工程与电子技术, 2002, 24(4): 9–11.
[12] 杨伟, 倪黔东, 吴军基. BP神经网络权值初始值与收敛性问题研究[J]. 电力系统及其自动化学报, 2002, 14(1): 20–22.
[收稿日期: 2017-07-17 修回日期: 2017-10-18]
(编辑  刘博)