张晓蕾胡成欢翻译马新华校对
摘要:
背景:本研究的目的是验证先前发表的一套基于欧洲重症监护病房(ICU)创伤性脑损伤(TBI)患者管理的共识质量指标集,并研究其对治疗质量监测和改进的潜力。
方法:我们的分析基于在年至年间入住54个重症监护病房的名成年患者,这些患者被纳入中心-TBI研究。指标得分以结构和流程指标的依从性百分比和结局指标的事件发生率或中位数计算。可行性通过变量的完整性来量化。差异性由中心间差异决定,用随机效应回归模型估计,根据病例组合严重程度进行调整,并用中位优势比(MOR)量化。结局指标的统计不确定性判断由每个研究中心的结局事件的中位数确定,以10为界。
结果:从中心-TBI数据库可以计算出总共26/42个指标。事实证明,大多数质量指标都可以达到70%以上的完整性。大多数质量指标的依从性为次优,对于结构和流程指标,其依从性范围为26%至93%和20%至99%。在7个流程和5个结局指标中发现显著的中心间差异,MOR为1.51至4.14(p0.)。结局指标的统计不确定性普遍较高;7个结局指标中有5个指标每个中心的发生事件小于10例。
结论:总体而言,有9个结构指标,5个流程指标,但是没有任何一个结局指标表现出可以改进ICU中TBI患者治疗质量的潜力。未来的研究应集中于落实治疗标准和对质量指标的不断重新评估。
关键词:质量指标、标准制定、创伤性脑损伤、重症监护病房、医疗质量
背景:
仅有有限的循证依据可用于指导脑外伤(TBI)患者的重症监护实践。随机对照试验表明,可转化为临床实践的指标的潜力有限,目前正在探索改善治疗的新方法,如治疗质量监测。TBI患者的治疗质量登记可以成为新兴的国际重症监护病房(ICU)或创伤治疗中心的一部分。随着时间的推移和跨中心的使用,大型数据集为治疗标准的制定和治疗质量改进提供了基础,即提供治疗反馈、中心间治疗方案讨论以及研究最佳实践方法的机会。
如在其他医学领域(如癌症,急性冠状动脉综合征和囊性纤维化)中所表现的那样,国际注册机构可以通过确定需要改善质量的领域,制定卫生政策,提高透明度和问责制来改善患者的治疗。仅当使用标准化质量指标并应用严重程度不同病例混合校正后,ICU之间的TBI管理基准才能可靠。质量指标可以细分为结构,流程和结局指标。由于没有针对TBI患者的质量指标集,我们最近进行了一项Delphi研究,以就质量指标集的制定达成共识。
本研究的目的是验证基于共识的质量指标集。在此,我们分析了来自欧洲神经创伤疗效协作性研究(中心-TBI)的TBI患者的大量数据。为中心-TBI收集的数据包括对54个医学中心的ICU病房和患者临床结局的全面统计描述,从而提供了评估新开发的指标集的可用性的机会。根据验证结果,可以将指标集缩减为最具实施潜力的指标集。
方法:
指标集选择:
在本验证研究中,我们将先前开发的基于Delphi研究的质量指标集应用于中心-TBI研究。质量指标集由17个结构指标、16个流程指标和9个结局指标组成,适用于ICU的成人TBI患者。
数据:
中心-TBI研究是一项在欧洲进行的多中心观察队列研究,在年至年期间招募患者(Clinicaltrials.govNCT)。核心研究包含名患者。中心-TBI研究的纳入标准为TBI的临床诊断,受伤后24小时内入院,有CT扫描的指征,而排除标准则是先前存在严重的神经系统疾病,可能会混淆对患者临床结局评估。我们为这项研究选择了ICU患者,因为基于共识的指标是专门为ICU制定的。因此,我们研究的纳入标准是(1)入住ICU病房(2)18岁以上的成年人。每天获得ICU治疗过程数据(生命体征、干预措施和治疗强度)。在ICU、创伤后3个月、6个月、12个月和24个月时评估治疗结局。此外,参与中心填写了关于治疗结构和流程的问卷。
指标得分:
我们确定这些指标是否可以从中心-TBI数据库中计算出来,以及数据收集是否符合常规做法。
结构指标得分是根据概况问卷计算的,并以表明人员配比和设施配备存在或不存在的中心数量。
流程指标的得分:坚持该流程的患者人数(分子)除以每个中心可以应用该流程的患者人数(分母)。
结局指标的得分:每个中心的结局指标发生率(分子)除以该指标可以获得评分的患者总数(分母)。对于扩展的格拉斯哥预后量表(GOSE)和健康调查量表第二版(SF-36)评分,计算了中位数。
指标的质量验证:
指标的质量评估基于三个标准:可行性、差异性和统计不确定性。由于以前没有关于这些标准的研究报道阈值,所以我们根据共识设定先验阈值。
可行性:
可行性解决了数据质量问题,并简化了指标质量的计算。
通过计算指标所需变量的完整性来量化可行性。我们将大于数据的70%完整性设置为阈值来确定该指标的使用可行性。
差异性:
为了评估各医学中心之间的差异,我们确定了不同医学中心遵循治疗标准的差异,以评估其基准测试和质量改进的潜力。
结构指标的中心间差异由该中心的人员配比和设备组成决定。对于结构和流程指标,我们将80%~90%的差异性定义为中度差异性,将90%~%的依从率定义为低度差异性。如此高的依从率减少了中心之间的差异。
流程和结局指标得分的中心间差异,根据病例严重程度组合和统计不确定性进行调整,用中位优势比(MOR)进行量化。MOR代表两个随机选择的中心中具有相同患者特征的两个患者遵守特定治疗指标的几率。MOR越高,中心间差异越大(MOR等于1表示没有变化)。
对于流程和结局指标,我们认为四分位间距较小(IQR10)或调整后中心间差异不显著或MOR为1.1或更低的指标中心间差异较小。不同严重程度的病例混合和不确定性调整后的每个中心的流程和结局指标得分显示在卡特彼勒曲线图中。
统计不确定性:
可靠性是指质量指标的可重复性,受到指标定义不明确和统计不确定性的影响。本研究中我们通过统一计算指标或是对定义进行较小的更改来提高可靠性。由于一些指标发生的数量较少,随机性较大而产生统计不确定性。结局指标的统计不确定性由各医学中心事件的中位数决定。我们将高统计不确定性的阈值设置为10个事件。
统计分析:
中心和患者基线特征用频率和百分比表示。用logistic回归分析计算流程和结局指标得分的中心间差异。我们使用随机效应模型(中心随机效应)来解释这样一个事实,即在仅有少量患者的中心,由于随机效应,指标可能具有极值。因此,我们的研究仅包括收治ICU患者数10的中心。为了校正病例组合,我们使用了IMPACT预后模型:核心指标(年龄、运动评分、瞳孔光反应性)、CT指标(缺氧、低血压、硬膜外血肿、外伤性蛛网膜下腔出血和MarshallCT分类)、实验室指标(第一葡萄糖和血红蛋白)和损伤严重程度评分(ISS)。根据τ2(随机效应方差)计算MOR。
每个中心的混合病例以及经过不确定度调整后的流程和结局指标得分显示在“卡特彼勒”图中。通过似然比检验,比较有无中心随机效应的模型,计算确定中心间变异显著性的p值。由于零假设在参数空间的边界上,因此需要混合分布来计算p值。对于随机效应模型的计算,缺失数据采用多重(N=5)插补,用MICE软件包进行统计分析。
结果:
可从中心-TBI数据库中提取Delphi数据集中42个指标中的26个指标。(包含11个结构指标,8个流程指标和7个结局指标)。
基线数据:
纳入了来自18个国家的54个医学中心,共计名成人患者。每个中心纳入的ICU患者的中位数为23人(IQR12-43,范围2-)。中心大多是学术中心(N=51;94%),并被指定为I级创伤中心(N=37;69%)。大多数中心位于北欧(N=20;37%)或西欧(N=19;35%)(表1)。
ICU入院患者中约28%年龄超过65岁,且大多数为男性(N=;73%)。根据基线GCS评分,48%患者为重度(GCS9;N=),16%为中度(GCS9-12;N=)和48%轻度TBI(GCS13-15;N=)。大多数患者(N=;96%)患有多发伤。损伤原因主要与道路交通事故(N=;44%)或偶然跌倒(N=;42%)有关(表1)。
依从率:
关于结构指标,大多数指标的依从率均为次优,包括神经重症监护室(N=35;65%)、手术室24小时可用率(N=40;75%)和观察病房(N=38;70%)。患者与护士的比率各不相同,据报道,每个护士需要管理1个(N=14;26%)、1-2个(N=23;43%)和2-3个患者(N=17;31%)。“包括特定指南的方案的存在”(N=47;89%)、“葡萄糖管理方案”(N=43;81%)、“通话后30分钟内神经外科医生可以到场”(N=49;93%)和“CT扫描和放射科医生的全天候复查”(N=50;91%)等指标的依从性很高。
在大多数治疗流程指标中发现次最佳依从率,包括在重型TBI组中进行ICP监测(中位数69%,IQR44-82),5-7天内的基础热量摄入(N=20%,IQR3-47)和“接受低分子量肝素预防DVT的患者”(中位数63%,IQR49-78)。“72小时内完全肠内营养”的指标依从性很高(中位数为99%,IQR87-)。
就结局指标而言,这些中心的ICU中位死亡率为12%[9-21],呼吸机获得性肺炎(VAP)发生率为14%[0-31],高血糖发生率为35%[22-45]。格拉斯哥预后评分中位数为5[3-7],SF-36健康调查量表第二版躯体部分评分(PCS)为46[37-54],心理部分评分(MCS)为46[36-55]。
结构指标的可行性普遍较高(总体上超过98%的有效数据)。一个过程指标的可行性很低:“24小时内机械性DVT预防”(43%的有效数据)。结局指标的可行性很高,除了TBI6个月后收集的SF-36MCS和PCS评分(28%的有效数据)。
总体而言,一个流程和一个结局指标显示可行性较低(表2)。
医学中心间差异性:
由于各中心的总体依从率较高,各中心之间的设备指标得分差异较小(改进空间很小),如“有标准治疗方案”、“神经外科医生在30分钟内到场”和“CT扫描和放射科医生的全天候复查”。对于流程指标,除“SDH或EDH患者在4小时内手术”(图1)外,所有指标(MORs均高于1.5,p0.)均存在较高的差异。
对于结局指标,中心之间的差异也是显著的。呼吸机获得性肺炎(VAP)的中心间差异尤其大,MOR为4.12。TBI后六个月的格拉斯哥评分的中心间变化很小(MOR=1.29,p=0.5)(图2)。
总体而言,5个结构指标、2个流程指标和4个结局指标显示出低差异性(表2)。
统计不确定性:
四个指标的定义略有改动,但内容没有改变。结局指标高血糖、重症监护病房死亡率和呼吸机相关性肺炎(VAP)的中位事件数分别为8、4和3例。低血糖和褥疮的中位事件数为零。所有这些事件低发生率率都反映了统计上的高度不确定性。
讨论:
我们的研究表明,在数据完整性的基础上,从最近提出的、基于共识的外伤性脑损伤(TBI)质量指标集中获得大多数质量指标是可行的。次优的依从性得分与中心间差异相结合表明质量改进的潜力,特别是流程和结局指标。然而,结局指标的统计不确定性普遍较高,使其不太适合作为质量改进的基准。基于对可行性,差异性和统计不确定性的评估,我们发现了9个结构指标,5个流程指标,但是没有发现任何一个结局指标表现出可以改进ICU中TBI患者治疗质量的潜力。总体而言,TBI患者的ICU治疗管理质量可以提高,我们的研究分析为如何在大型数据库中挑选TBIICU治疗质量指标提供了有用的案例。
据我们所知,这是第一个在入住ICU的成年TBI患者中开发和验证的质量指标集。我们总结了有潜力用于制定基准和质量改进的治疗指标。首先,我们通过排除给定数据集中具有低可用数据(低可行性)的指标来减少初始集合。某些流程指标的收据收集不完整可能是由于收集过程指标数据的复杂性和高资源需求所致。然而,未来的自动数据提取可以提高可行性。其次,研究中心间差异较大的质量指标(本研究中的大多数质量指标)和次优的依从率(较大的差异性)有潜力用于提高治疗质量和进行基准测试。
根据欧洲重症监护病房对大多数质量指标的次优依从性,TBI危重病人的治疗质量可能在各个方面得到改善。调整后的仍然较大中心间差异表明,一些中心的表现明显优于其他中心。在结构和流程的质量指标方面表现良好的中心和/或记录不良结果发生率较低的中心广泛分享最佳做法和实施策略,可以改善表现较差的中心的绩效。
以前的研究也报告了整个欧洲在TBI治疗过程中不同医学中心之间的巨大差异。这种中心间的变化可以用遵循指南的不同来解释。虽然89%的中心表示他们遵守了脑创伤基金会(BTF)的指南,但实际操作时可能有所不同。例如,重型颅脑损伤(GCS9)患者的ICP监测是BTF指南中较高水平的证据建议之一,但在我们的研究中,我们发现跨中心的依从率只有44-82%(IQR)。这意味着在减少循证医疗过程中的差异性还有很大的空间。先前的一项研究报告了TBI儿童的质量指标表现。尽管他们的指标与当前研究中的指标不同,但他们发现中心间的差异较小(在68%到78%之间)。目前已经有几个指标用于一般的ICU或创伤治疗。我们测试的一些结局指标也在目前的ICU中登记使用,但在我们的研究中表现不佳(褥疮和低血糖)。例如,在我们的研究中,褥疮的发生率接近0%,医院,大约6%的患者出现褥疮。
这项研究有几个优点。首先,我们在一个大型临床数据集中测试了基于共识的质量指标的潜力,而大多数先前的研究只报告了一个德尔菲研究来制定质量指标,并且只有少数研究在实施前对质量指标进行了初步测试。第二,指标得分来自于中心-TBI数据库,该数据库包含了许多ICU中的大量TBI患者。事实上,这一分析为在更大范围内研究TBI管理的指标潜力和中心间差异提供了第一次机会。中心-TBI数据库只有一个排除标准(先前存在严重的神经系统疾病,可能会混淆对患者临床结局评估),因此它代表了一个可以推广到整个欧洲TBI人群的队列。
我们的研究也有一定的局限性。在中心-TBI数据库中,只能获取一部分关于人员配备和设施配置的数据只有一部分被记录。其余的结构指标基于问卷调查,可能不准确。所有重度TBI患者都被纳入分析。我们认识到,选择ICU住院时间较长的患者可能增加了中心间的可比性,但我们通过纠正所有中心间对病例混合严重程度的分析缓解了这一问题。我们将可行性定义为数据的完整性,而可行性的其他方面,如可访问性、及时性和中心级别的数据缺失,则无法解决。统计上的不确定性反映在事件发生的数量上,我们决定不测试最终指标集的结构效度(指标之间的相关性)和标准效度(与临床结局的关联),因为这些都很难测试;对于结构效度,很难在治疗过程中找到指标之间的预定相关性,而且通常与临床结局不相关;对于标准效度,指标质量将因病例组合的调整而异,即使非常复杂的模型也不能针对所有残余偏差(未测量的混淆)进行调整。然而,在更大的数据库中正在对这些指标进行的评估可能包括评估这些指标与患者临床结局的相关性。
未来在欧洲登记中心实施质量指标记录将使TBI患者数据监测在不同国家之间成为可能。该登记中心向个别重症监护病房提供的信息反馈对于使相关从业者了解其医疗中心的治疗效果并帮助制定内部质量改进方案至关重要。目前还没有定义质量指标的参考标准。我们的研究还说明了一些研究缺陷,因为其中一些指标相当复杂,很难回顾性评估。然而,这种数据收集可以通过对事件发生的时间和过程进行常规登记、自动数据提取和明确的定义来优化。总体而言,本研究所述方法可用于优化未来的数据收集(统一指标定义和提高数据质量),评估指标质量(跨中心调整),并确定需要进一步研究的领域。
结论:
这项研究验证了一项大型前瞻性TBI研究(中心-TBI)中基于共识的基础指标集质量。根据许多质量指标的次优依从率和中心间差异,TBI危重患者的治疗质量似乎可以在多个方面得到改善。此外,我们的分析显示了这些指标总体上良好的可行性和较低的中心间差异,但在一些结局指标上具有较高的统计不确定性。未来的研究应侧重于落实治疗标准和改进治疗质量工作,以及对指标质量的持续重新评估。
长按识别后