0%

临床研究基本概念:筛查试验(二)

说明:
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

应用似然比优化临床诊断

一、摘要

  1. 似然比能够优化基于体征和症状的临床诊断;然而,很少被应用于患者医疗保健。
  2. 似然比是指特定试验结果的患病人群百分比除以相同试验结果的健康人群百分比。
  3. 理想状态下,异常试验结果应该在患者中更典型(高似然比),而正常试验结果应该更多地出现在健康人群中(低似然比)。
  4. 似然比接近1对决策制定没有帮助,相反,高或低的似然比能极大左右临床医师对疾病概率的评估。
  5. 各种试验均能计算似然比,不仅仅是结果为二分类变量(阳性或者阴性)的试验,多水平结果的试验也可以进行。例如,肌酸激酶或者肺通气-血流灌注显像。
  6. 结合正确的临床诊断,辅助检查的似然比可以协同改善诊断的准确性。

二、前言

无论似然比(likelihood ratios)对临床发现、实验室检査、影像学检査结果的解释多么有用,却很少被应用。大多数临床医生对似然比很不熟悉,在实践中很少应用。我们的目标是增加临床医师对似然比的理解和应用程度。

一些人认为流行病学家是通过一个\(2 \times 2\)表格来窥视整个世界。确实,如果每个人能被分为有病的或健康的,如果判断疾病的二分类试验被广泛应用,那么60亿的我们(纵使拥挤)也将恰当地分布于如图所示的表格中(图1)。遗憾的是,无论生命或者试验均不是这么简单,充满了灰色区域。似然比能够帮助临床医师驾驭这片诊断不明确的巨大区域。

似然比是指特定试验结果的患病人群百分比除以相同试验结果的健康人群百分比。似然比是对患病人群中特定试验结果(如阳性)的可能性和无病人群中相同试验结果(如阳性)可能性的比较。

A likelihood ratio is the likelihood of a given test result in a person with a disease compared with the likelihood of this result in a person without the disease.

在这里,百分率(Percentage)和可能性(Likelihood)是可以相互替换的。它的含意就非常清楚:患者比健康人更可能得到异常的试验结果,这种差异的大小具有重要的临床意义。

三、两分类结果试验的似然比

(一)阳性似然比

  1. 图1下方的\(2 \times 2\)表格显示了似然比的计算方法。在这个例子中,共15位患者,其中12人(80%)的疾病试验结果为真阳性。相反,在85位健康者中有5人(6%)出现假阳性。因此,阳性结果的似然比就是这两个百分比的比值(80%/6%),等于13。换言之,相比健康人群,患病人群得到阳性结果的可能性高出13倍。
  2. 对于一个二分类试验(阴性或阳性),这个被称为阳性似然比 (positive likelihood ratio)(缩写为LR+)。

(二)阴性似然比

阴性似然比(negative likelihood ratio)(LR-)的计算方法类似。15位患者中3人(20%)出现假阴性(false negative)结果,同时85位健康者中80人(94%)得到真阴性结果,所以LR-就是这两个百分比的比值(20%/94%),等于0.2。因此,患者获得阴性结果的可能性是健康者的1/5。

(三)计算方法总结

  1. 如果灵敏度和特异度已经明确:
    • \[LR+ = \cfrac{灵敏度}{1-特异度}\]
    • \[LR- = \cfrac{1-灵敏度}{特异度}\]
  2. 如果\(2 \times 2\)表格的原始数据可以获得:
    • \[LR+ = \cfrac{a/(a+c)}{b/(b+d)}\]
    • \[LR- = \cfrac{c/(a+c)}{d/(b+d)}\]
  3. 如果数学方程式不能应用:
  • \[LR+ = \cfrac{真阳性百分比}{假阳性百分比}\]
  • \[LR- = \cfrac{假阴性百分比}{真阴性百分比}\]

四、多分类结果试验的似然比

计算两种以上结果试验的似然比类似于二分类结果的计算。每个试验结果水平都可以简单地计算单独的似然比。在表格1中,白细胞计数提示59人为阑尾炎,145人没有此诊断。

  1. 现计算白细胞计数为\(7 \times 10^9/L\)的似然比,2%是分子(阑尾炎),21%是分母(没有阑尾炎),则似然比为\(\cfrac{0.02}{0.21}=0.1\)
  2. 同样的计算可以在不同的白细胞计数水平上进行
  3. 最高值,计算无法实施,因为分母为0
  4. 似然比的范围从0.1到无穷大,并呈现白细胞计数越大,似然比值越高的趋势。

但这些似然比改变了临床实践吗?他们使诊断疾病的可能性低到把患者从急诊室送回家,或高到有充分理由进行手术?

  1. 大多数患者(82%)的白细胞计数在\(7 \times 10^9\)\(19 \times 10^9/L\);似然比的范围从0.523.5,对患病可能性的作用较小。换言之,4/5的患者在评估阑尾炎的时候,白细胞计数对诊断没有帮助。仅极端数值可以明显影响患病可能性。
  2. 设想一名28岁男性,肺栓塞的验前概率为20%,他的肺通气-血流灌注扫描是正常的,似然比为0.1。如果我们在左侧栏定位于20%,中间栏为0.1 则右侧栏显示验后概率为2%(图2C)。

前列腺特异抗原(PSA)筛査前列腺癌提供了多项似然比(multiple likelihood ratios)的另一个例子。

在一项2620名男性受试者、年龄大于等于40岁的社区研究,调查者进行前列腺癌特异抗原的检测及应用前列腺活检作为诊断金标准。

标准临界值定在4μg/L,阳性试验的似然比为1.3(95%可信区间1.21.3),阴性试验为0.4(0.40.5):对临床帮助不大。

然而,根据PSA浓度进行拆分后,结果变得更有用(表格2)。

  • 最低值(<2μg/L)的似然比是0.3

  • 最高值(>20μg/L)的似然比是6.3

  • 这些似然比使肿瘤的验前概率发生了中等程度的改变

五、似然比的运用

临床医师经常在进行每个试验前对某个特定疾病的可能性(probability)有所估计(虽然一般无法精确地定量)。按照贝叶斯定理(Bayesian principles),验前的疾病比值 (pretest odds)乘以似然比(the likelihood ratio)得到验后的疾病比值(post-test odds)。

例如,验前比值为3/1乘以似然比2,将产生验后比值为6/1。

不像赌徒(或统计学家),大多数临床医生不会想到比值比(odds)——我们通常应用百分率(percentages)。

例如,75%的可能性(75%是/25%否)等同于比值比3/1。

虽然比值比(odds)和可能性(probabilities)之间的相互转换涉及简单算术,但一种被广泛应用的列线图解法(nomogram)(图2)统 一实现了这个步骤。

从左侧一列查出疾病的验前概率(pretest probability),将该点与中间栏的似然比相连,直线的延伸部分与右侧栏相交的点即为疾病的验后概率(post-test probability)。这个流程显示了试验结果调整了验前概率。

例如,在图1下方的表格中,阳性试验的似然比是13,阴性试验的似然比是0.2。假设疾病的验前概率为0.25,而且试验结果是阳性的。在列线图左侧找到验前概率0.25,截取似然比3,连成一直线,并延长直线至右侧栏找到验后概率大约为0.8,诊断可能性发生了重 大的改变(图2B)。这个值非常接近于贝叶斯公式计算的验后概率0.81。

列线图解法被广泛应用。但是,如果不能使用列线图,可以采用各种更巧妙的办法。

  • 例如,可以从互联网上下载计算验后概率的滑尺(a slide rule)。
  • 英国牛津的循证医学中心(The Centre for Evidence-Based Medicine in Oxford, UK)设计了一种彩色的交互式计算机列线图,能利用活动的箭头替代直线。

其他网络软件还可以计算\(2 \times 2\)表格似然比的95%可信区间。既然似然比是可能性的比值(ratios of probabilities),那么我们就可以像危险比(risk ratios)那样计算95%可信区间。可信区间(Confidence intervals)显示了结果估计的精确度。

六、似然比大小的临床意义

  1. 不同数值的似然比有不同的临床意义。临床医师凭直觉就可以理解,似然比为1.0对诊断没有帮助:患病和健康人群试验结果的百分比是相同的。
  2. 试验结果不能鉴别疾病和健康,就算是复杂的、昂贵的(可能存在风险)的试验,验前概率没有改变。
  3. 所有似然比的比值从1开始,向下延伸至0,向上至无穷大。因此,似然比越远离1,对患病可能性的作用越大。
    • 似然比从2到5使患病验后概率轻度增加
    • 从5到10中等增加
    • 大于10显著增加
    • 对于小于1的比值,似然比越小,患病可能性越低

七、一种有用的记忆法

遗憾的是,列线图解法和计算机通常在床旁不能被采用。因此,McGee提出一种记忆方法,能简化似然比的应用,并拥有较好的可操 作性。他指出验前概率在10%〜90%之间(通常情况),试验或临 床发现所致疾病概率的变化近似于一个常量。临床医师仅需记住3 个标志性的似然比:2,5,10(表格3)。这正好对应于15%的前三个 倍数:

  • 似然比为2,增加疾病可能性15%
  • 似然比为5,增加疾病可能性30%
  • 似然比为10,增加疾病可能性45%

例如,验前概率是40%,似然比为2,那么验后概率为40%+15%=55%(非常接近用公式计算的57%)。
似然比小于1,规则相反。2的倒数是0.5,5是0.2,10是0.1。似然比为0.5,那么减少验前概率15%,当似然比为0.1时将显著下降45%。

八、验前概率准确的重要性

既往史(medical history)与体格检查一直都是非常根本和重要的。事实上,对疾病概率(验前概率)的精确判定,有时候比来源于昂贵的或侵入性试验的似然比更重要。一些疾病,如阿尔茨海默病和鼻窦炎等,临床所见能产生一个相当准确的诊断。而对于其他疾病,临床医师缺乏体征和症状预测值的信息,他们必须依赖流行病学数据、教育和临床敏锐性。

例如,补充的患者疾病史使冠心病的验前概率从75%下降至小于5%,这样的改变对验前概率的影响超过一个阳性和阴性似然比为3和0.5的心脏负荷试验的影响。

虽然临床诊断未必会比辅助试验更准确,但它的精确性对后续任何试验结果的解释都将产生显著的作用。一个准确的验前概率(pretestprobability)和后续试验(subsequent testing)能很好地优化临床诊断。

九、决策阈值

只有当可能影响临床处理时,试验才被使用。如果临床医师判断的患病验前概率已经能安全地肯定或否定诊断,那么进一步的试验是没有必要的。

更多的试验应该在临床不确定的情况下才被考虑(如图3)。在试验进行前,应该明确检查阈值(Test threshold)和治疗阈值(Treatment threshold)(图3中的A和B)在连续的诊断疾病可能性(diagnostic certainty)上的位置。

  • 疾病概率低于A点可以有效地排除诊断,于是,A就是进行试验的阈值:即验前概率大于A但小于B有可能从后续试验中获益。
  • B点是治疗阈值,疾病概率高于此点应判断可以给予治疗,不应再有任何延误。

这些决策阈值(decision thresholds)(A和B)的位置应该个体化。运用列线图(图2A),临床医生可以估计多大或多小的似然比使验前概率移动到A点以下(排除诊断)或B点以上(开始治疗)。临床医师可以参考已发表的似然比,确定相应的试验结果。如果试验结果不能实现患病概率的这种移动,就不应该进行该试验。这是非常基本和重要的一点。

十、似然比的优点

既然大多数临床医师已经熟悉灵敏度和特异度,是否值得进一步努力学习如何应用似然比?似然比具有某些吸引人的特点,是传统的试验真实性(test validity)指标所没有的。

  1. 不是所有的试验都有二分类结果。当结果不仅仅是阴性或阳性时,试验真实性的方程式将无能为力。许多临床医学试验得出连续性结果(如血压)或者多个等级水平的结果(如乳腺肿块的细针穿刺活检)。将多项分类结果强行改成阳性或阴性将丢失信息。似然比使医师有能力解释和使用诊断试验的所有结果。

  2. 其次,似然比简单易行,适用范围广。相反,试验(tests)的预测值(predictive values)受疾病的患病率影响,即使再完美的试验也可能因为患病率很低而出现很差的阳性预测值。似然比不受疾病患病率的影响,其在一系列不同患病率的疾病中均可使用。预测值与人群的试验特性(test characteristics to populations)有关,而似然比可以被应用到某个特定的患者。此外,似然比与传统的真实性指标不同,需要合并\(2 \times 2\)表格的所有4格数据。

  3. 依赖灵敏度和特异度经常会夸大试验的益处。比较两种产科试验(胎儿纤连蛋白fetal fibronectin预测早产、子宫动脉多普勒波形分析预测先兆子痫preeclampsia),2/3发表的报道高估了试验的价值。应用似然比,而不仅仅是灵敏度和特异度,将可能避免这种误解。

  4. 似然比改善了临床判断。将似然比应用到诊断中将改善诊断疾病的可能性(the diagnostic probability),有时是相当明显的。当试验按序执行时,第一个试验的验后概率(the post-test odds)成为第二个试验的验前概率(the pretest odds),以此类推。

十一、似然比的局限性

  1. 似然比对验前概率的影响不是线性的。似然比100是似然比10的10倍,但并没有增加10倍的验前概率,如图2D所示。
  2. 多分类结果试验的极端试验值产生不精确的似然比。有这些并不精确的高值或低值的患者数量很少。在这些单元格中,患病人数微小的改变能产生非常不同的似然比。换言之,在最高和最低的试验值分布区,似然比的不精确性非常多见。将试验结果分布中靠近极值的连续性分类合并,可以得到较多的患者数目,从而使结果更准确,如更窄的可信区间(confidence intervals)。
  3. 相反,许多试验结果分布在中心区域。这里,似然比接近1,因此帮助小。重要的决定因素(big payoffs)来源于高或低的似然比
  4. 另一个问题就是在三级医疗单位中产生的验前概率可能无法被统一采用,因为面向的患者人群不同。

十二、似然比应用的实例

(一)以验前概率为基础进行试验的指南

  1. 当验前概率高或低时,临床医师应谨慎安排试验。此时,试验不能改变患病的概率,只会导致情况更紊乱:因为不能预测的结果(unexpected results)通常是假阳性或假阴性。

  2. 当验前概率为50%时,试验将非常有帮助。见图2,起始点在验前概率栏50%的地方比其他任何位置,其列线图验后概率的数值变化都要明显。

  3. 无论试验结果如何,患病的验前概率越高,其验后概率也越高。

    例如,高3倍的验前概率将比低值产生高出3倍以上的验后概率。

  4. LR+大于10意味着阳性试验能很好地诊断疾病。

  5. LR-小于0.1意味着阴性试验能很好地排除诊断。

  6. 当序贯进行各项试验时,第一个试验的验后概率成为下一个试验的验前概率。不同试验之间相互联系,按序进行。

(二)应用实例

临床上可以广泛应用似然比,包括:症状、体格检查、实验室检查,以及影像学和评分系统(表格4)。基于正确的疾病验前概率,辅助检查的似然比往往能在重要途径上优化临床判断。