1

心血管病高危人群健康效用测量工具的选择:EQ-5D-5L与SF-6Dv2的应用验证

孙菊, 郭倩, 李浩淼, 姚强, 祝淑珍, 李俊琳

【作者机构】 武汉大学政治与公共管理学院; 武汉大学健康治理研究中心; 湖北省疾病预防控制中心
【分 类 号】 R197
【基    金】 湖北省疾病预防控制中心项目(202505004)
全文 文内图表 参考文献 出版信息
心血管病高危人群健康效用测量工具的选择:EQ-5D-5L与SF-6Dv2的应用验证

·卫生服务研究·

心血管病高危人群健康效用测量工具的选择:EQ-5D-5L与SF-6Dv2的应用验证

孙 菊1,2* 郭 倩1 李浩淼1,2 姚 强1,2 祝淑珍3 李俊琳3

1. 武汉大学政治与公共管理学院 湖北武汉 430072

2. 武汉大学健康治理研究中心 湖北武汉 430072

3. 湖北省疾病预防控制中心 湖北武汉 430079

【摘 要】目的:以我国心血管病(Cardiovascular Diseases,CVD)高危人群筛查与干预项目为应用场景,系统评估EQ-5D-5L和SF-6Dv2量表在心血管病高危人群中的适用性。方法:采用Spearman相关系数比较两量表聚合效度;采用组内相关系数(ICC)、Bland-Altman图比较一致性,并采用多元线性回归分析探讨两量表效用差异的影响因素;采用Kruskal-Wallis检验和t检验比较区分度;采用效应量(ES)、相对效率(RE)和ROC曲线下面积(ROC-AUC)比较灵敏度;比较天花板效应与地板效应。结果:5 415个CVD高危人群中,两量表聚合效度较好,但各维度相关性较差,且测量结果一致性水平较低(ICC=0.367)。两量表对健康状况的区分度均较好,但SF-6Dv2的灵敏度更优且天花板效应更轻微。结论:在测量心血管病高危人群健康效用值时,量表选择需审慎,尤其是针对风险级别较高群体,使用SF-6Dv2更合适。

【关键词】CVD; EQ-5D-5L; SF-6Dv2; 健康效用值

1 问题的提出

心血管病(Cardiovascular Diseases,CVD)已经成为全球公认的重大公共卫生问题之一。我国心血管病患病人数已高达约3.3亿,是城乡居民疾病死亡的首要死因,且发病率和死亡率仍处于持续上升阶段,不仅严重威胁居民身心健康,还带来巨大的直接疾病经济负担[1],成为威胁我国人群健康和社会发展的重要因素[2]。为此,我国自2014起启动“心血管病高危人群早期筛查与综合干预项目”,旨在降低心血管疾病发病率、复发率、致残率和死亡率。[3]截至2024年,该项目已覆盖全国31个省(自治区、直辖市)的370个区/县、4.8万个社区/村,累计筛查社区居民超过524.7万人次,检出心血管病高危对象146.4万人。[4]在资源约束的情况下,有必要对如此大规模健康干预项目的投入产出进行科学评估,确保政策制定及优化建立在坚实的证据基础之上。

在健康干预项目的效果评估中,如何科学、精准、灵敏地测量健康产出,不仅直接关系到评估的效力,也会影响干预向政策转化,并影响政策制定以及健康资源分配的科学性与公平性。质量调整生命年(quality-adjusted life years,QALYs)被广泛用于健康产出的测量,其计算公式为个体特定健康状态下的健康效用乘以该状态维持的实际生存时间(质量调整生命年=健康效用值×生存时间)[5],其中健康产出测量的精准性取决于健康效用测量工具的选择。健康效用(health utility) 是指人们对特定的健康状态,或某一干预措施所带来的健康结局的偏好程度,取值通常在0~1之间,其中0代表死亡状态,1代表完全健康状态,比死亡更差健康状态(如极度疼痛)的效用值为负。[6]国际上已经开发了一系列健康效用测量量表,EQ-5D和SF-6D是其中应用最广泛的不受特定疾病限制、适用于各类人群的普适性量表[7],但二者隐含的健康价值观不同,在维度构成、积分体系和文化适应上均存在差异,导致两者在相同人群中效用值可能存在系统性偏差。既往研究有关两个量表测量效度高低问题,结论并不一致[8-10],尤其是在我国心血管病高危人群中的应用情况及其差异尚未得到充分探讨。鉴于此,本文以我国心血管病高危人群筛查与干预项目为应用场景,系统评估EQ-5D-5L和SF-6Dv2量表在CVD高危人群中的适用性,为测量工具选择、优化心血管病高危人群筛查和干预项目评估方案提供新的证据。

2 数据与方法

2.1 数据来源与研究对象

本研究数据来源于湖北省疾病预防控制中心2023年在湖北省15个县(市、区)组织开展的“心血管病高危人群筛查与干预项目”,筛查对象为35~75岁常住居民。该项目采用多阶段目的抽样方法,结合区域代表性、政府支持力度、医务人员参与积极性、居民健康档案完善程度、交通便利性及既往公共卫生项目工作基础等因素,在每个县(区)确定1~2个具备较好实施条件的乡镇或街道作为筛查点。本研究以该筛查项目中识别的高危人群为研究对象。高危对象的判断标准为(符合其中之一):有心血管病史 符合四条中的一条即可:心肌梗死病史;接受经皮冠状动脉介入治疗(Percutaneous Coronary Intervention,PCI);接受冠状动脉搭桥手术(Coronary Artery Bypass Grafting,CABG);脑卒中(缺血型脑卒中或出血型脑卒中)病史。;血压高、血脂异常 符合三条中的一条即可:收缩压(Systolic blood pressure,SBP)≥180mmHg或舒张压(diastolic blood pressure,DBP)≥100 mmHg;低密度脂蛋白胆固醇(Low density lipoprotein-cholesterol,LDL-C) ≥180mg/dl(4.14mmol/L);高密度脂蛋白胆固醇(High density lipoprotein-cholesterol,HDL-C)<30 mg/dL(0.78mmol/L)。;根据2008 年世界卫生组织发布的《心血管风险评估和管理指南》中的风险评估预测图十年心血管病患病风险≥20%。项目针对识别出的高危对象进行了问卷调查,除了解个人社会经济特征、健康行为、疾病史等状况外,还对每一位心血管病高危对象同时采用EQ-5D-5L 和 SF-6Dv2量表测量了健康效用。项目共筛查28 934 人,识别出心血管病高危对象6 212 人,剔除关键变量缺失、信息填写错误样本之后,最终纳入5 415个分析样本。

将心血管病高危人群按照健康风险等级进行分级。研究表明,发生心血管事件的患者其健康效用值低于未发生心血管事件的患者且差异较大[11],合并心血管病的患者已属于极高危个体[12];除此以外,共病人群相较于患单一疾病人群健康状况更差[13]。故按照CVD健康风险从低到高将高危人群分为五级:第一级为仅WHO评估预测十年CVD患病风险≥20%,且未确诊为高血压、糖尿病、高血脂或CVD疾病 CVD疾病包括心肌梗死、冠脉介入治疗PCI(支架植入、球囊扩张)、搭桥手术(CABG)、脑卒中、心绞痛、心力衰竭、瓣膜疾病、心律失常、外周血管病9种。;第二级为确诊高血压、糖尿病或高血脂中的任意一种,但未确诊CVD;第三级为确诊高血压、糖尿病或高血脂中的两种及以上,但未确诊CVD;第四级为确诊1种CVD疾病;第五级为确诊2种及以上CVD疾病。

2.2 健康效用的测量与计分

EQ-5D-5L包含5个维度,即行动能力、自我照顾、日常活动、疼痛/不适和焦虑/抑郁,每个维度5个等级。SF-6Dv2包含6个维度,即身体功能、角色限制、社会功能、疼痛、心理健康和活力,每个维度5~6个等级。分别根据LUO等[14]和WU等[15]依据中国人群偏好构建的健康效用价值积分体系来计算EQ-5D-5L和SF-6Dv2的效用值,前者的得分区间为[-0.391,1],后者的得分区间为[-0.277,1]。

2.3 研究方法

使用EXCEL对数据进行汇总,采用STATA15.1对数据进行统计分析。从聚合效度(convergent validity)、一致性、区分度(discriminate validity)、灵敏度、天花板/地板效应五个维度系统评估两个量表针对CVD高危人群的适用性。

第一,聚合效度。聚合效度指在同一时点,不同测量工具对同一特征测量的结果显示出预期关联的程度,即相似度[16],使用Spearman相关系数进行分析。由于缺乏金标准用以判断两个量表各维度与其相关性,且两个量表都是测量健康效用值的权威量表,本文参考OBRADOVIC等人的研究[17],比较两个量表各个维度之间的相关性。理论而言,两量表应该在相似维度上表现出较强的相关性。

第二,一致性分析。使用组内相关系数(intraclass correlation coefficient,ICC)分析两量表健康效用值的总体一致性;使用Bland-Altman图可视化比较两个量表在不同健康效用值水平人群的测量一致性。其中, 表示组间方差, 表示组内方差。

进一步使用多元线性回归,以两量表效用值差异(diff=Ueq-5d-Usf-6d)作为因变量,以心血管病高危人群的五个风险级别为自变量,控制样本性别、年龄、婚姻状况、教育程度、职业、人均家庭收入、当前吸烟状况、当前饮酒状况、平时是否参加体育锻炼和EQ-VAS等混杂因素,观察心血管病高危人群的不同风险级别对两量表效用值差异的影响。这一结果用以评估具体在哪些风险级别的高危人群中,两量表测量的一致性较好或较差。

第三,区分度,用于判断量表能否区分已知群体分组(the ‘known-group’)内的特征差异,在本研究中则用于评估量表能否区分不同风险级别的CVD高危人群。首先,使用Kruskal-Wallis检验,识别五个风险级别人群的健康效用值分布是否存在显著差异;然后,对各个风险级别进行两两比较,使用t检验分析差异。

第四,灵敏度,用于判断量表是否可以识别不同风险级别CVD高危人群之间的健康效用值差异。参考既往研究[18-20],使用效应量(effect size,ES)、相对效度(relative efficiency,RE)和受试者工作曲线下面积(area under the receiver operating characteristic curve,AUC)来评估两个量表的灵敏度,计算方法见表1。

表1 比较维度与测算方法

聚合效度一致性Spearman相关系数组内相关系数(ICC)Bland-Altman图多元线性回归相关系数(r)绝对值越大表示相关性越强,相关系数大于0.5代表强相关性;0.35~0.5代表中等相关性;0.2~0.34相关性较差。[19]ICC 大于0.80一致性较好,0.61~0.80为中等,0.41~0.60为一般,0.11~0.40为较低,0.1以下为无一致性。[21]根据图形分布判断是否存在系统性差异。根据回归系数及显著性,用以分析具体在哪些风险级别的高危人群中,两量表测量健康效用的一致性较好或较差。比较维度 研究方法 判断标准

表1 比较维度与测算方法(续)

区分度灵敏度天花板/地板效应Kruskal-Wallis检验t检验效应量(ES)相对效度(RE)受试者工作曲线下面积(ROC-AUC)最优(天花板)/最差(地板)健康状态的受访者占比(%)已知群体分组间效用值存在显著差异(P<0.05),则说明有区分度。使用t 检验对不同风险级别人群的健康效用值进行两两比较,P<0.05,则说明有区分度。ES 为两组均值之差除以合并标准差,合并标准差是根据校正后的标准误差和各组中个体的加权数来估计的[22],值越大说明灵敏性越好。RE通过对比两组对象量表得分的t值平方来评估灵敏度,以EQ-5D的t值平方作为分母。若RE>1,SF-6D更灵敏;若RE<1,EQ-5D更灵敏。综合评估不同阈值下的灵敏度-特异度平衡。AUC 在0~1之间,若AUC=1表示区别力最佳,非常灵敏;若AUC≤0.5则没有区别力;AUC越接近1,区别力越好,越灵敏。<15%则认为天花板/地板效应较小;大于15%则认为严重。[23]比较维度 研究方法 判断标准

第五,天花板/地板效应,同样用于敏感度分析。天花板效应指大部分受试者的得分集中在量表的最高分段,无法区分高风险个体之间的差异;地板效应指大部分受试者的得分集中在量表的最低分段,无法区分低风险个体之间的差异。参考WU、HARRISON等研究[18,21],使用最优(天花板)/最差(地板)健康状态的受访者占比(%)进行评价。各指标测算方法或判断标准如表1所示。

3 研究结果

3.1 研究对象一般特征

5 415位受访心血管病高危人群一般特征见表2,其中,男性占49.86%,女性占50.14%,平均年龄为61.43岁。58.43%受访者EQ-VAS得分在90分及以上。将心血管病高危人群按照健康风险等级从低到高划分为5级,1级和2级风险人群合计占比超过50%,达到5级风险的人数占4.78%。患病率最高的为脑卒中(8.55%),其次为心肌梗死(3.42%)和经皮冠状动脉介入数(3.35%)。

表2 研究对象分布特征

性别男女年龄(岁)35~45~55~65~婚姻状况未婚/丧偶/离婚已婚教育程度高中以下高中及以上职业非农农业家庭人均年收入(元)0~10 000~20 000~2 700(49.86)2 715(50.14)215(3.97)904(16.69)1 983(36.62)2 313(42.71)404(7.46)5 011(92.54)4 424(81.70)991(18.30)3 246(59.94)2 169(40.06)1 532(28.29)1 836(33.91)2 047(37.80)高血压无有糖尿病无有高血脂无有心肌梗死无有经皮冠状动脉介入术无有搭桥手术无有脑卒中无有2 545(48.11)2 745(51.89)4 362(83.02)892(16.98)4 610(89.43)545(10.57)4 968(96.58)176(3.42)4 987(96.65)173(3.35)5 067(98.27)89(1.73)4 729(91.45)442(8.55)变量 N(%) 变量 N(%)

表2 研究对象分布特征(续)

注:饮酒情况为“是”指一周至少1~2天饮酒。

吸烟状况否是饮酒状况否是参加体育锻炼否是EQ-VAS 0~90~高危人群分级第一级第二级第三级第四级第五级4 460(82.38)954(17.62)4 438(81.96)977(18.04)2 446(45.17)2 969(54.83)2 250(41.57)3162(58.43)644(15.77)1 704(41.73)632(15.48)908(22.24)195(4.78)心绞痛无有心力衰竭无有瓣膜疾病无有心律失常无有外周血管病无有5 284(97.58)131(2.42)5 334(98.50)81(1.50)5 374(99.24)41(0.76)5 289(97.67)126(2.33)5 324(98.32)91(1.68)变量 N(%) 变量 N(%)

3.2 聚合效度

采用Spearman相关系数评价两量表间的相关性水平(表3),结果表明EQ-5D-5L和SF-6Dv2量表所测的总体效用值具有中等相关性(r= 0.465,P<0.001)。进一步比较各维度之间的相关性,发现EQ-5D量表中的“疼痛或不舒服”维度和SF-6Dv2量表中的“疼痛”“活力”两个维度,EQ-5D-5L量表中的“焦虑或沮丧”维度和SF-6Dv2量表中的“精神健康”“活力”两个维度表现出中等相关性,其他维度之间相关性较弱。这表明,两量表之间聚合效度较好,测量结果具备一定可靠性;但其他弱相关维度也反映出两量表在测量维度的关注点上存在差异,需进一步对比分析以明确二者在测量CVD高危人群健康效用中的适用性。

表3 两量表各维度相关性分析

注:使用Spearman相关分析,P<0.001。

SF-6Dv2躯体功能角色限制社会功能疼痛精神健康活力EQ-5D-5L行动能力0.239 0.241 0.256 0.235 0.251 0.222自我照顾0.189 0.199 0.214 0.173 0.196 0.162日常活动0.232 0.268 0.264 0.217 0.244 0.240疼痛或不舒服0.250 0.325 0.309 0.473 0.331 0.358焦虑或沮丧0.215 0.312 0.327 0.280 0.377 0.353

3.3 一致性分析

通过计算ICC及绘制Bland-Altman图,评价两量表测量健康效用值的一致性水平。计算得到ICC值为0.367,说明两量表在心血管病高危人群中所测得的效用值一致性水平较低,在选择时需要谨慎。进一步以EQ-5D-5L和SF-6Dv2量表所测效用值的差值为纵坐标,平均值为横坐标,绘制Bland-Altman图(图 1)。结果显示:EQ-5D-5L所测健康效用值与SF-6D所测健康效用值的差值,普遍分布在平均差异值(0.097)的上方,说明EQ-5D-5L测量值整体上高于SF-6Dv2,二者测量结果存在系统性差异。尤其可以发现,当二者平均效用均值在0.5~0.9之间时,EQ-5D-5L所测健康效用值普遍偏高,说明两量表效用值在不同健康水平的心血管高危人群中存在差异。

图1 Bland-Altman plot分析

多元线性回归分析结果显示(表4),在控制混杂因素后,不同健康风险分级对EQ-5D-5L与SF-6Dv2所测健康效用的差异值均存在显著影响,而且随着风险级别的增加,回归系数也依次增加,这进一步说明,当心血管风险级别较高时,两量表测量的健康效用值差异更为显著。此外,EQ-VAS(Coef = -0.015,P<0.001)得分与两量表效用值差异呈显著负相关,说明在主观健康感知越差的个体中,两量表测得的健康效用值差异更明显,进一步佐证两量表测量健康效用值的不一致性主要存在于高风险人群中。

表4 两量表效用值差异回归结果(N=4 080)

注:回归分析时,因某些自变量存在缺失值,最终纳入分析的样本量为4 080。

变量高危人群分级(对照组:第一级)第二级第三级第四级第五级性别(对照组:女)年龄(岁,对照组:35~)45~55~65~婚姻状况(对照组:未婚/丧偶/离婚)教育程度(对照组:高中以下)职业(对照组:非农)人均家庭年收入(元,对照组:0~)10 000~20 000~当前吸烟状况(对照组:无)当前饮酒状况(对照组:无)平时是否参加体育锻炼(对照组:无)EQ-VAS(对照组:0~90)回归系数0.015 1 0.015 4 0.028 6 0.040 8-0.006 3-0.023 0-0.010 9-0.004 1 0.000 2-0.007 9-0.008 9 0.002 7-0.003 3-0.008 6 0.001 1-0.001 0-0.014 7标准误0.006 0.007 0.006 0.010 0.004 0.013 0.012 0.012 0.007 0.005 0.004 0.005 0.005 0.005 0.005 0.004 0.004 P值0.006 0.021<0.001<0.001 0.129 0.075 0.379 0.737 0.978 0.126 0.023 0.562 0.487 0.069 0.827 0.786<0.001

3.4 区分度

Kruskal-Wallis检验结果如表5所示,EQ-5D-5L和SF-6Dv2健康效用值在不同健康风险分级人群中存在统计学差异(P<0.001),说明两量表均对心血管病高危人群健康差异状况有区分度。

表5 两量表对CVD高危人群风险级别的区分度比较

注:P值通过Kruskal-Wallis(多分类变量)检验获得。

变量高危人群分级第一级第二级第三级第四级第五级EQ-5D-5L均值(标准差)0.965(0.101)0.965(0.097)0.971(0.072)0.951(0.111)0.942(0.122)中位数(P25,P75)1.000(1.000,1.000)1.000(1.000,1.000)1.000(1.000,1.000)1.000(0.942,1.000)1.000(0.893,1.000)P值<0.001 SF-6Dv2均值(标准差)0.884(0.122)0.869(0.132)0.873(0.122)0.840(0.139)0.820(0.162)中位数(P25,P75)0.920(0.803,1.000)0.903(0.785,1.000)0.915(0.794,0.971)0.852(0.756,0.962)0.841(0.727,0.962)P值<0.001

进一步对各级风险人群间的健康状况差异进行比较,结果见表6。两量表结果一致性结果显示:(1)第一级与第三级、第二级与第三级、第四级和第五级风险人群之间健康状况无显著差异;(2)第一、二、三级分别与第四、五级风险人群健康状况间存在显著差异。说明未患CVD疾病但具有心血管病高危因素的高危人群,与患CVD疾病的高危人群间健康状态存在显著差异;但有一种或多种心血管病高危因素的人群间健康效用值差异并不显著;有一种或多种CVD疾病人群间健康效用值差异也并不显著。两量表测量差异在于,SF-6Dv2所测效用值第一、二级之间也存在显著差异(P=0.010), EQ-5D-5L则未测出,说明对于这两类人群,SF-6Dv2具有更高的区分度。

表6 对按风险分级后健康状况差异的区分情况

注:表中统计量为t值,P值通过Two-sample t test检验获得;***P<0.001、**P<0.01。

EQ-5D-5L第一级第二级第三级第四级SF-6Dv2第一级第二级第三级第四级第二级第三级第四级第五级-0.106 1.086-2.686**-2.692**—1.37-3.404***-3.023**——-4.015***-4.065***——————-1.759-0.964-2.564**-1.646-6.455***-5.888***—0.686-5.164***-4.719***-4.784***-4.852***

3.5 灵敏度

计算ES、RE、AUC来比较两个量表对按风险分级后健康状况差异的灵敏度,结果见表7。结合其判断标准,三个指标均显示SF-6Dv2灵敏度更优。进一步使用DeLong检验比较两个 ROC曲线下AUC是否有显著差异[24],结果显示,在风险一级和四级、一级和五级群体之间,两量表AUC有显著差异,进一步说明,SF-6Dv2灵敏度更优。

表7 按风险分级后健康状况差异的灵敏度比较

分级比较一级 vs. 四级一级 vs. 五级二级 vs. 四级二级 vs. 五级三级 vs. 四级三级 vs. 五级EQ-5D-5L t-2.686-2.692-3.404-3.023-4.015-4.065 ES 0.138 0.220 0.140 0.228 0.208 0.333 RE 1 1 1 1 1 1 AUC 0.552 (0.529,0.575)0.574 (0.535,0.613)0.546 (0.527,0.564)0.569 (0.531,0.606)0.550 (0.527,0.572)0.573 (0.533,0.612)SF-6Dv2 t-6.455-5.888-5.164-4.719-4.784-4.852 ES 0.333 0.481 0.212 0.357 0.248 0.397 RE 5.778 4.785 2.302 2.438 1.420 1.425 AUC 0.597 (0.569,0.625)0.617 (0.571,0.664)0.564 (0.541,0.587)0.587 (0.543,0.631)0.565 (0.537,0.594)0.589 (0.541,0.636)DeLong检验P值0.001 0.038 0.090 0.349 0.252 0.455

3.6 天花板与地板效应

比较EQ-5D-5L和SF-6Dv2两量表各维度“最优状态”(天花板)和“最差状态”(地板)的占比情况(表8),发现EQ-5D-5L各维度“最优状态”占比在80%~96%区间,SF-6Dv2各维度则在45%~62%区间,均低于EQ-5D-5L。从总体健康效用值来看,EQ-5D-5L的 天 花 板 效 应(74.18%)比SF-6Dv2(25.12%)更明显,说明EQ-5D-5L在区分高健康水平个体方面可能更受限。两量表“最差状态”的占比均较低,说明两量表均未有地板效应。

表8 天花板和地板效应状况

ED-5D-5L行动能力自我照顾日常活动疼痛或不舒服焦虑或沮丧总效用值SF-6Dv2躯体功能角色限制社会功能疼痛精神健康活力总效用值“最优状态”占比(%)91.99 96.25 93.67 80.28 86.50 74.16 45.91 57.53 61.11 60.90 62.07 53.06 25.12“最差状态”占比(%)0.28 0.15 0.15 0.07 0.17 0.04 0.31 0.30 0.22 0.00 0.15 0.20 0.02

4 讨论

本研究系统比较了EQ-5D-5L和SF-6Dv2量表测量CVD高危人群健康效用值的差异,发现两量表聚合效度较好,但测量结果一致性水平较低,选择量表时需审慎;两量表对健康状况的区分度均较好,但SF-6Dv2的灵敏度更优且天花板效应更轻微,相对更适用于CVD高危人群健康效用值的测量。

4.1 两量表结果一致性低,选择需审慎

本研究发现,EQ-5D-5L与SF-6Dv2量表在测量CVD高危人群健康效用值时一致性偏低,EQ-5D-5L健康效用均值比SF-6Dv2健康效用均值高,与既有文献一致。[25]可能归因于两量表间构成维度和响应尺度的差异。构成维度上,CVD高危人群的健康相关生命质量与社交活动[26]、疲乏感知[27]等情况均相关,但EQ-5D-5L重点关注个体的生理功能,未包含上述维度;SF-6Dv2则整合了社交和心理功能维度,能反映更多元的健康损害。在响应尺度上,EQ-5D-5L的响应选项反映的是个体填写问卷时的即时感受,而SF-6Dv2则要求回顾过去一段时间内的整体健康状况,兼顾健康问题的严重程度与持续时间。CVD高危人群的健康问题往往具有缓慢进展和长期累积的特征,且其高危因素通常具有隐匿性和波动性,即使当下健康感知良好,仍可能存在潜在的慢性损害,这进一步加剧了两量表在测量结果上的偏差。

本研究进一步发现,心血管病高危风险分级是影响两量表效用值差异的关键因素。与仅存在高危因素的人群相比较,在患CVD疾病的人群中,差异会进一步被放大。这一结论与本研究发现健康状况较差的人群中两个量表的差异较大这一结论相呼应。既有研究表明,CVD患者的心理困扰率显著高于无CVD的患者。[28]SF-6Dv2具备更丰富的心理社会维度,而EQ-5D-5L未能反映该维度状态,且EQ-5D-5L倾向于高估健康状况不佳患者的效用值[29],导致效用值差异随着健康状态的恶化而进一步增大。

4.2 两量表区分度良好,但SF-6Dv2灵敏性更优

尽管存在结构差异,但两量表均表现出良好的区分效度,能够识别CVD高危人群间的健康差异,具备作为CVD高危人群筛查和干预评估工具的基础能力。但是,SF-6Dv2在细分健康风险等级分组中表现出更高的灵敏度,而且天花板效应更弱,接近一半的CVD高危人群在EQ-5D-5L上报告完全健康但仍可以通过SF-6Dv2问卷测出各健康维度存在不佳状态。可能的原因在于,本研究CVD高危人群中的大部分尚未确诊心血管疾病,仅存在相关高危因素,其健康损害尚处于功能下降与主观体验之间的模糊地带。有研究指出,SF-6Dv2在检测外部健康指标(如高血压、糖尿病、其他慢性疾病等)方面的效率比EQ-5D-5L高出29.0%~179.2%。[16]说明SF-6Dv2在捕捉这一类“亚临床”健康变化方面更敏感,而EQ-5D-5L灵敏性相对有限。

5 结论与建议

在“心血管病高危人群筛查与干预项目”及类似公共卫生干预中,评估干预效果不仅需要判别是否健康,更应敏锐捕捉个体健康状态变化的幅度,需优先选择能全面反映健康变化、灵敏度更高的测量工具。因此,基于本研究发现,建议在CVD高危人群中优先选用SF-6Dv2量表进行健康效用值测量,其更高的敏感性更有利于评估干预效果及识别亚群体差异。应警惕EQ-5D-5L存在高估健康效用值的倾向,避免影响干预效果的准确判定。尤其注意在健康状况较差的人群中,两量表效用值差异较大,需审慎选择。在制定干预策略时,需要根据CVD风险级别,采取不同的干预策略。可参考世界卫生组织《心血管风险评估和管理袖珍指南》建议,对具有心血管疾病危险因素但尚无明确临床症状者采取一级预防措施,而对确诊人群采取二级预防措施,加强生活方式干预措施和适宜的药物治疗。

本研究样本来自湖北省CVD高危人群,将描述性统计分析结果与我国ChinaHEART队列(n=4 404 586)中CVD高危人群(n=998 673)的调查特征进行对比[30],发现两个样本在人口和社会经济特征、疾病史、危险因素方面差异较小,这表明本研究的结论具有一定的普适性,且数据来源可靠,评估维度较全面,能够为我国CVD高危人群健康效用测量工具的选择提供科学依据。但是,本研究结果基于横截面调查,在论证EQ-5D-5L和SF-6Dv2的可靠性、适用性时,可能受限于横截面研究的固有缺陷,论证力度不如纵向和前瞻性研究。且本研究在对已知群体分析时缺乏客观组,即没有“金标准”的客观指标来比较,只能通过两个量表的相对比较来进行评估,导致结论的外推性尚需进一步验证。

作者贡献:孙菊、李俊琳负责文章的构思与设计;孙菊、郭倩负责数据处理分析和论文的撰写;李浩淼、姚强负责数据的整理与收集、论文修订与审校;祝淑珍负责思路指导、把握文章质量。

作者声明本文无实际或潜在的利益冲突。

参 考 文 献

[1]中国心血管健康与疾病报告编写组. 中国心血管健康与疾病报告2022 概要[J]. 中国循环杂志, 2023, 38(6):583-612.

[2]李春燕, 简伟研. 中老年人心血管疾病经济负担: 基于中国健康与养老追踪调查的实证分析[J]. 中国卫生政策研究, 2017, 10(5): 75-80.

[3]国家卫生计生委办公厅关于印发心血管疾病高危人群早期筛查和综合干预项目管理办法(试行)的通知[EB/OL].(2014-08-27)[2025-06-20].https://ncncd.chinacdc.cn/gwxw/201506/t20150618_116196.htm

[4]我国心血管病高危人群早期筛查项目已覆盖31 个省区市_央广网[EB/OL]. (2024-04-19)[2025-06-20]. https://news. cnr. cn/native/gd/20240419/t20240419_526673021.shtml

[5]DRUMMOND M E, SCULPHER M J, TORRANCE G W,et al. Methods for the Economic Evaluation of Health Care Programmes[M]. Oxford University Press, 2005.

[6]谢诗桐, 陈丕楠, 贺小宁, 等. 国内外普适性健康效用量表综述研究[J]. 中国卫生政策研究, 2020, 13(8):58-68.

[7]RÄSÄNEN P, ROINE E, SINTONEN H, et al. Use of quality-adjusted life years for the estimation of effectiveness of health care:A systematic literature review[J]. International Journal of Technology Assessment in Health Care, 2006, 22(2): 235-241.

[8]KONTODIMOPOULOS N, STAMATOPOULOU E, GAZI S, et al. A Comparison of EQ-5D-3L, EQ-5D-5L, and SF-6D Utilities of Patients with Musculoskeletal Disorders of Different Severity: A Health-Related Quality of Life Approach[J].Journal of Clinical Medicine, 2022, 11(14):4097.

[9]FERREIRA L N, FERREIRA P L, PEREIRA L N.Comparing the performance of the SF-6D and the EQ-5D in different patient groups[J]. Acta Medica Portuguesa, 2014,27(2): 236-245.

[10]XU R H, DONG D, LUO N, et al. Evaluating the psychometric properties of the EQ-5D-5L and SF-6D among patients with haemophilia[J]. The European Journal of Health Economics, 2021, 22(4): 547-557.

[11]SMITH D W, DAVIES E W, WISSINGER E, et al. A systematic literature review of cardiovascular event utilities[J]. Expert Review of Pharmacoeconomics & Outcomes Research, 2013, 13(6): 767-790.

[12]中国心血管病风险评估和管理指南编写联合委员会.中国心血管病风险评估和管理指南[J]. 中国循环杂志, 2019, 34(1): 4-28.

[13]施博文, 熊巨洋. 慢性病共病对中国老年人健康相关生命质量的影响研究[J]. 人口与发展, 2024, 30(1):120-128.

[14]LUO N, LIU G, LI M, et al. Estimating an EQ-5D-5L Value Set for China[J]. Value in Health, 2017, 20(4):662-669.

[15]WU J, XIE S, HE X, et al. Valuation of SF-6Dv2 Health States in China Using Time Trade-off and Discrete-Choice Experiment with a Duration Dimension[J]. Pharmaco Economics, 2021, 39(5): 521-535.

[16]XIE S, WANG D, WU J, et al. Comparison of the measurement properties of SF-6Dv2 and EQ-5D-5L in a Chinese population health survey[J]. Health and Quality of Life Outcomes, 2022, 20(1): 96.

[17]OBRADOVIC M, LAL A, LIEDGENS H. Validity and responsiveness of EuroQol-5 dimension (EQ-5D) versus Short Form-6 dimension(SF-6D) questionnaire in chronic pain[J]. Health and Quality of Life Outcomes, 2013, 11(1): 110.

[18]WU J, HAN Y, ZHAO F L, et al. Validation and comparison of EuroQoL-5 dimension (EQ-5D) and Short Form-6 dimension (SF-6D) among stable angina patients[J].Health and Quality of Life Outcomes, 2014, 12: 156.

[19]ZHAO F L, YUE M, YANG H, et al. Validation and Comparison of EuroQol and Short Form 6D in Chronic Prostatitis Patients[J]. Value in Health, 2010, 13(5):649-656.

[20]韩月蓉, 吴晶, 丛洪良, 等. EQ-5D 和SF-6D 对中国稳定性心绞痛患者应用的效度和灵敏度评价[J]. 中国卫生统计, 2013, 30(6): 829-832.

[21]HARRISON M J, DAVIES L M, BANSBACK N J, et al.The comparative responsiveness of the EQ-5D and SF-6D to change in patients with inflammatory arthritis[J].Quality of Life Research: An International Journal of Quality of Life Aspects of Treatment, Care and Rehabilitation, 2009, 18(9): 1195-1205.

[22]余红梅, 罗艳虹, 萨建, 等. 组内相关系数及其软件实现[J]. 中国卫生统计, 2011, 28(5): 497-500.

[23]MARTINS W P, ZANARDI J V C. Subgroup analysis and statistical power[J]. European Journal of Obstetrics &Gynecology and Reproductive Biology, 2011, 159(1): 244.

[24]HUANG Y, WANG K, WANG W, et al. Association between different triglyceride glucose index-related indicators and overactive bladder[J]. Diabetes Research and Clinical Practice, 2025, 223: 112128.

[25]BLIEDEN BETTS M, GANDRA S R, CHENG L I, et al.Differences in utility elicitation methods in cardiovascular disease: a systematic review[J]. Journal of Medical Economics, 2018, 21(1): 74-84.

[26]邓清文, 刘文彬. 心血管疾病患者健康相关生命质量及其影响因素的多水平模型分析[J]. 山东大学学报(医学版), 2020, 58(7): 115-121.

[27]张霖, 董林玉, 张祖仪, 等. 基于多重对应分析法的心血管病早期筛查试点区高危人群影响因素研究[J]. 医学与社会, 2021, 34(6): 6-11, 17.

[28]MATSUMURA K, KAKIUCHI Y, TABUCHI T, et al.Risk factors related to psychological distress among elderly patients with cardiovascular disease[J]. European Journal of Cardiovascular Nursing, 2023, 22(4): 392-399.

[29]VERSTEEGH M M, ROWEN D, BRAZIER J E, et al.Mapping onto EQ-5D for patients in poor health[J].Health and Quality of Life Outcomes, 2010 (8): 141.

[30]WANG R, YANG Y, LU J, et al. Cohort Profile: China HEART (Health Evaluation And risk Reduction through nationwide Teamwork) Cohort[J]. International Journal of Epidemiology, 2023, 52(5): e273-e282.

Selection of health utility measurement tools for high-risk populations with cardiovascular disease: Application validation of EQ-5D-5L and SF-6Dv2

SUN Ju12GUO Qian1LI Hao-miao12YAO Qiang12ZHU Shu-zhen3LI Jun-lin3
1.School of Political Science and Public AdministrationWuhan UniversityWuhan Hubei 430072China
2.The Research Center for Health GovernanceWuhan UniversityWuhan Hubei 430072China
3.Hubei Province Center for Disease Control and PreventionWuhan Hubei 430079China

【Abstract】 Objective: In the context of China's cardiovascular disease (CVD) high-risk population screening and intervention project, this study systematically evaluates the applicability of the EQ-5D-5L and SF-6Dv2 instruments among individuals at high risk of CVD. Methods: Convergent validity was assessed using Spearman's correlation coefficient. Measurement agreement was evaluated through intraclass correlation coefficients (ICC) and Bland-Altman plots. Factors influencing utility differences were explored using multiple linear regression analysis.Kruskal-Wallis test and t-test were used to examine discriminant validity. Sensitivity was compared by effect size(ES), relative efficiency (RE), and the area under the receiver operating characteristic curve(ROC-AUC). Floor and ceiling effects were also compared. Results: Among 5,415 individuals at high risk of CVD, the two instruments showed moderate overall correlation and acceptable convergent validity, but dimension-specific correlations were weak, and measurement consistency was low (ICC=0.367). Both instruments effectively distinguished different health states, yet the SF-6Dv2 demonstrated superior sensitivity and a milder ceiling effect. Conclusion: When measuring the health utility value of CVD patients, scale selection should be cautious, especially for high-risk groups, and SF-6Dv2 is more appropriate.

【Key words】 Cardiovascular Diseases; EQ-5D-5L; SF-6Dv2; Health utility value

中图分类号:R197

文献标识码:A

doi:10.3969/j.issn.1674-2982.2025.08.003

* 基金项目:湖北省疾病预防控制中心项目(202505004)

作者简介:孙菊(1971年—),女,博士,教授,主要研究方向为医药卫生体制改革理论与政策。E-mail:sunphh@126.com

通讯作者:李俊琳。E-mail:22536033@qq.com

[收稿日期:2025-07-07 修回日期:2025-08-06]

(编辑 刘博)

X