说明:
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research
随机试验的样本量波动:剔除、失访及不确定者
一、摘要
- 如果研究者不能在主要分析中包括所有被随机化分组的受试者,那么随机化就失去了意义。
- 受试者可能不愿参加随访,离开了居住地,或者应服用阿司匹林却服用了阿司帕坦。
- 在随机化之前剔除不合适的受试者不会使治疗的比较产生偏倚,但是会影响试验结果的外推性。
- 一个试验在随机化前的入选标准应该是清晰的、特异的、可执行的。
- 读者需要评估入选标准中是否存在一些条款,会使试验样本人群呈非典型性或不能代表所感兴趣的人群。
- 原则上,对随机化之后剔除的评估非常简单:即任何发生在随机化之后的剔除均是不允许的。
- 在主要分析时,需包括所有受试者,并且按原分组进行分析(意向性分析)。但实际中,常常会有失访,因此,研究者必须采取充分的措施尽可能地留住受试者。
- 此外,研究者还可利用试验档案等形式提供试验过程中被随机化分组的受试者的清晰信息。
- 在次要分析中,研究者还可以进行按方案或按治疗的受试者分析。这些分析应该被描述为次要分析,并注明是非随机化的比较。
- 对剔除的不恰当处理会导致严重的方法学问题。然而,有些对不恰当剔除的解释吸引了读者,掩盖了其问题的严重性。对剔除的不恰当处理会减弱研究的真实性。
二、前言
如果研究者不能在主要分析中包括所有被随机化分组的受试者,那么随机化就失去了意义。因此,评价一个随机对照临床试验的关键原则是评价其剔除(exclusions)、退出(withdrawals)、失访(losses),以及偏离研究方案(protocol deviations)的情况。
那么研究者应该如何处理拒绝入组、忽视随访、离开居住地,或应服用阿司匹林却服用阿司帕坦(aspartame)的这些研究对象呢?
许多处理以上问题的方法貌似具有逻辑性和吸引力,但事实上都是不合适的,因为这些方法会引入偏倚。以下,我们将分析随机化前后剔除受试者带来的不同影响。
三、随机化之前剔除研究对象
(一)影响与建议
- 研究者可以在随机化开始前剔除研究对象(exclusions before randomisation)。无论研究者剔除研究对象的理由是充足(well-founded)的还是异想天开的,这对最终随机化后的治疗方法间的比较不产生影响(具有很好的内部真实性/internal validity)。但这一阶段剔除研究对象会影响研究结果的外推性(extrapolation)(即外部真实性/external validity)。
- 对于大多数研究者,我们建议在设计大型、单中心研究时尽量制定最低入选标准。
- 在某些情况下,剔除一些研究对象是合理的。例如,研究对象具有干预措施的禁忌证,或者他们很有可能成为失访者。
- 研究问题决定了研究方法。有时候,研究者制定了过多的入选标准以至试验结果外推的人群极小,没人感兴趣。此外,也会使入选研究对象变得十分困难。
- 如果研究者剔除了过多的研究对象,或是错误地剔除了研究对象,尽管此项随机对照临床试验进行得非常严谨,但是,他们的研究结果将失去对研究人群的代表性(即试验结果是正确的但是却没有应用的意义)。
(二)在随机化之前剔除研究对象应注意的问题
恰当的入选标准应该指明研究者希望外推研究结果的人群。
- 在判断一个试验的研究结果前,读者应首先确定入选标准是否清晰、特异。
- 在随机化过程之前应用入选标准是关键。
- 读者还应当评价是否有某些入选标准使研究样本不典型、不具有代表性,或与研究所感兴趣的人群不相关。
- 但实际上,研究结果很少是完全不相关的:“我们的患者和研究的受试者存在量的差异(他们的年龄、社会阶层、结局事件的危险等级以及对治疗的反应不同)而不是质的差异(完全没有治疗反应或是没有任何危险因素)。这种对治疗反应质的差异是很少见的;
因此,临床试验还是趋于有很好的外部真实性的。
四、随机化之后剔除研究对象
(一)影响与建议
- 在随机化之后剔除研究对象(Exclusions after randomisation)会使治疗效果间的比较产生偏倚。随机化分组可使治疗组间在基线时具有可比性。任何使治疗组间偏离这种可比性的因素都会导致偏倚,除非这些因素是随机产生的,但这又不太可能。
- 因此,在主要分析(primary analysis)时,统计学家都建议纳入所有参与随机化分组的研究对象,而且将他们归入随机化时的原组别分析。研究者都倾向于使用这种意向性分析(intent-to-treat analysis)。简单来说,一旦受试者被随机化分组了,就应按照随机化时的分组进行分析。
- 对一个随机对照试验进行主要分析时使用意向性分析可以避免那些与非随机化丢失受试者相关的偏倚。研究者也可以按照是否完全遵从试验方案或实际接受的治疗分组(按接受治疗与否)来进行次要分析(secondary analyses),这样的次要分析最好是事先计划的。
- 只要研究者标明这些是次要分析和非随机化的比较,那么,次要分析就是可以接受的。但当研究者剔除受试者,把实际上是次要的、非随机化的比较当作主要的、随机化的比较来报道,问题就会滋生。这种分析使临床试验类似于队列研究,却被标榜为随机对照临床试验。在分析时剔除受试者可能会得到错误的结论(Panel 1)
- 研究者常常不提供那些被剔除者的信息。在一项对1997年发表在主要医学期刊上的249个随机对照临床试验的回顾显示,只有2%(5/249)明确报道了所有参与随机化分组的受试者是根据原随机化分组进行分析的。有一半的文章(119/249)注明进行了意向性分析,却没有提供任何这方面的依据。
- 此外,研究者常常不报道是如何剔除受试者的。由于缺少这方面信息,读者误认为这些研究应用了意向性分析且没有任何受试者被剔除。我们称之为“无明显的剔除”。
- 读者常认为没有明显剔除受试者的研究偏倚较少,但实际上可能存在相当多的没有报道的受试者剔除。这种没有明显剔除受试者迹象的试验在方法上要弱于那些至少报道了一些剔除方面信息的研究。换句话说,有一些较多偏倚的研究被误解为没有偏倚,而许多较少偏倚的研究被误认为有偏倚;我们把这种不一致性称为剔除的悖论(exclusion paradox)。在研究者们全面报道随机化之后的受试者剔除情况前,读者应关注这一搅局的悖论。
- Panel 1:一项比较磺吡酮和安慰剂预防心肌梗死复发的临床试验
- 在这项试验中,研究者在主要分析中比较心源性死亡率,而非全因死亡率的差异。
- 在分析中,研究者因发现患者不符合研究入选要求而不恰当地剔除受试者,对试验结果造成了影响。剔除了7名因过去接受过治疗的受试者,其中6名在治疗组,1名在对照组,导致治疗组与对照组相比有更多死亡的患者被剔除。
- 美国食品与药物管理局详细的审查结果指出安慰剂组的一些患者也可以因为相同的标准而被剔除,但在试验中却没有。研究方案中也没有提到入组后剔除不适当受试者的相关事项,特别是已经死亡的患者。
- 研究者还剔除了2例治疗组和1例对照组的死亡病例,理由是依从性太差而无法分析。但在研究方案里却没有提到因依从性差而剔除受试者这一项。
- 研究者还使用了7日原则(7-day rule)。即如果一名患者至少7天未接受治疗或在治疗结束7天以后死亡均为不可分析的死亡病例。
- FDA委员会并没有对此项操作提出强烈批评,因为在试验方案中描述了此项规则,且这项规则的运用对总体结果也没有影响。
- 在这项试验中,对受试者的不恰当剔除最终影响了试验结果。虽然研究者初次报道治疗组的心源性死亡率下降了32%(P=0.058),然而对研究重新分析的结果显示治疗效果要弱得多,当包括了未被纳入和未被分析的所有研究对象时,死亡率下降仅21%(P=0.16)。值得注意的是这里使用了P。我们推荐使用可信区间报道结果。
- FDA确认该试验存在不恰当剔除影响试验结果。FDA委员会宣布磺吡酮不能作为或宣传为发生一次心肌梗死后数月的关键期内预防死亡的药物。因为在仔细检查后,发现这些数据不像一开始那样可信了。
(二)应注意的问题
- 在开始讨论如何在随机化过程后正确处理剔除受试者这一问题之前,我们必须承认讨论这一问题的基础很薄弱。关于如何剔除受试者的报道很少,而且剔除受试者的悖论误导着读者。
- 研究者应该提供整个临床试验中剔除受试者的清晰的、详细的过程。当缺少这方面的报道时,读者要持怀疑的眼光。CONSORT指南(CONSORT guidelines)声明中有专门的流程图作为指南。
- 最佳的情况是,研究者在随机化过程后没有剔除受试者并且应用意向性分析。
- 评价随机化之后剔除受试者是否恰当的答案很简单:这样做是不允许的。所有入选的受试者应该包括在原随机分配的组别中进行分析。虽然临床试验通常比较复杂,但这一原则总是成立的。
- 一个可以减少随机化过程之后剔除受试者的实用方法是,尽量在最后的时刻对受试者进行随机化分组。
- 如果在确定受试者时就进行随机化分组,而不是在治疗开始前进行,那么任何发生在治疗开始前的剔除都将成为随机化之后的剔除。
- 研究者可以通过推迟随机化分组过程到治疗开始前那一刻来解决这一问题。
- 如果研究者报道了他们在随机化过程之后剔除了某些受试者,那么我们应该仔细审视这些剔除过程,因为这可以使治疗组间的比较产生偏倚。
- 在随机化过程之后剔除受试者有很多原因,包括发现受试者不符合入选标准、在随机化之后治疗开始之前发生了结果事件、偏离研究方案、失访等。
五、发现不符合入选条件的受试者
- 在一些试验中,参与者被入选了,之后却发现不符合入选条件。这种情况通常不是随机发生的,所以在这一时刻剔除入选者会造成结果严重偏倚。例如,研究者更容易关注那些对治疗毫无反应或发生副作用的受试者,因此这些受试者比其他参与者更容易被判断为不符合入选条件。另一种情况是,如果一个医生认为某些病人适合某项治疗,当这些病人被随机化分入他认为不适当的治疗组时,他很有可能会终止这些病人的试验。
- 不符合入选标准的受试者应保留在试验中。有一种情况可以例外,即入选标准的确立较困难时。此时,研究者应该在随机化时,从每个病人获得相同的信息,并交由对治疗分组不知情的人员来判断他们是否符合入选标准。这一人员可以是个人或一个团队,用这种方式来减少偏倚。
六、随机化之后、治疗开始前发生结局事件
研究者有时报道,他们将那些在治疗开始前或治疗产生效果前发生结果事件的受试者剔除。
例如,在一项研究某一特殊药物对死亡率影响的临床试验中,研究者将那些在随机化分组后治疗开始前或在接受至少7天药物治疗之前死亡的受试者作为不可分析的数据剔除。
这种剔除很有吸引力,因为这些死亡不会被认为是治疗造成的。如果这一论证成立的话,那么在整个试验过程中,所有安慰剂组发生死亡的患者均可以被剔除,因为理论上,没有一例死亡和治疗相关。这一例子说明了随机化后治疗前剔除发生结局事件的受试者可能存在的问题。
随机化分组可以平衡各组间那些不可归因的死亡。任何在随机化分组后发生的受试者剔除,哪怕以最科学最公正的方式进行,也不能提高、相反是损害这种平衡。这作为不适当剔除受试者的一条“后验”理论(Post hoc rationale)。
后验理论(Post hoc rationalisation)是指研究者观察到结果后修改试验规则以利于证明他们的研究假设。
假定一个研究者认为某种药物可以减少某一情况相关的死亡率。在数据分析之后,研究者注意到在开始药物治疗前或服用药物尚未到7天时,治疗组有14例死亡而安慰剂组有2例死亡。然后研究者将这些死亡认定为与治疗无关的死亡,而从分析中剔除。在报道中把这种剔除说得再有逻辑性,也会严重偏倚研究结果。
如果是先验规则(a priori rationalisation),只会使试验的执行复杂化;如果是后验规则,则会引入偏倚并损害试验结果的真实性。
我们几乎不可能知道研究者在试验中何时制定了入选规则。
- 因此,比较乐于观察到的现象是在随机对照临床试验中,研究者并没有在随机化过程之后剔除受试者。
- 所有被随机化分组的受试者的数据均应包括在分析中。
- 在临床随机试验的分析中,不管是计划的还是非计划的,为了效率而剔除那些无法分析的结局事件通常是不能接受的
七、偏离研究方案
- 在很多试验中都会发生偏离所分配治疗的事件。有些研究者建议在最终分析时应剔除那些严重偏离所分配治疗的受试者,或者只包括偏离前的那部分数据。虽然这种方法看上去很有吸引力,但是它存在一个很严重的缺点:“偏离某一种治疗方案的人群和偏离另一治疗方案的人群是那么的不相同……,以至于留在原不同治疗组的患者间的比较存在严重偏倚。”
- 例如,研究者想了解预防性应用抗生素是否可以降低植入子宫内避孕器(IUD)后发热的发生率。
- 研究者随机将患者分入抗生素组和安慰剂组。
- 但在抗生素治疗组,25%的患者没有服用抗生素偏离了治疗方案。实际上这部分患者接受的治疗(没有任何治疗)和安慰剂组是相同的。
- 那么,研究者在分析时应剔除这部分患者吗?还是研究者应该将他们并入安慰剂组,与那些坚持接受治疗的抗生素组的病人进行比较呢?
- 一些研究者倾向于使用这些表面上看上去非常有吸引力的方法。
- 然而对于主要分析(primary
analysis),这些方法是不能接受的。因为这使得两个治疗组的患者不再具有可比性。
- 没有服用抗生素的患者可能是因为她们的健康状况更好或是对植入IUD的耐受性更好。
- 无论是以上哪一种情况,她们发生发热的可能性更小。
- 如果研究者将这部分偏离治疗的人剔除,那么抗生素组中剩余的是那些更易感染的患者:对治疗的比较遭到了偏倚。
- 如果研究者把这些偏离治疗的人归入安慰剂组一起分析,那么不仅抗生素组中剩余的是那些更易感染的患者,而且安慰剂组将混入那些不易感染的患者。
- 那些偏离治疗方案的人可以是更健康的,但也可以是病情更重的,但这一点并不重要,因为无论是哪种情况,治疗组间的比较都出现了系统性偏倚。
- 研究者应该随访所有偏离试验方案的患者,并且将他们的数据包括在原分配的组别中进行分析。
- 在上面这个例子中,偏离抗生素治疗方案的患者应该保留在该组中进行分析。
- 同样地,任何偏离安慰剂组治疗方案的患者也应该留在该组中进行分析。
- 不管在试验过程中发生了什么状况,研究者都应该比较随机被分配为抗生素治疗和安慰剂治疗的两组人。
- 这种方法可以为临床所感兴趣的问题(例如,在IUD植入前预防性使用抗生素是否可以预防发热?)提供非偏倚的切实的答案。
- 因此,如果研究者报道剔除了偏离试验方案的受试者,或者将偏离某一治疗方案的患者归入另一组分析,那么这种治疗方案间的比较是存在偏倚的,就会导致临床试验类似于观察性研究。
八、失访
失访(Losses to follow-up)可能是随机化过程后剔除受试者最让人烦恼的原因了。
- 原因可以是参与者搬家或拒绝继续参加试验等。
- 如果失访受试者的结果信息可以通过其他渠道获得,如国家死亡登记系统(national death registry),那么这些失访者仍可以包括在分析中。但是这种机会比较少。
- 如果没有有关这些失访者结局事件的信息,研究者别无选择,只能将他们从分析中剔除。
- 任何的剔除都会损害试验的内部真实性,比较组之间失访率的差异造成的影响更大。因此,研究者必须将失访减少到最低程度。
减少失访有时是很困难的。研究者必须重视并且尽力制定和 采取避免失访的一些措施。
- 例如,研究者可以在随机化过程之前把那些看上去很可能会失访的患者剔除。
- 另一种方法是通过获得的联系方式找到失访者,或雇用专人小组去拜访那些失访者。
- 或者两种方法联合运用。
某些研究者使用一些方法来提高随访率(这些方法不但可以提高随访率,还可以提高研究者所感兴趣的主要数据的质量)。
- 一种方法是使用多个地理位置佳,且容易随访的诊所。有的诊所交通不便利,研究者却还期望患者只去这一家诊所。
- 迎合受试者的兴趣和需要。
- 减短数据收集的步骤到可以掌控的范围。
- 随访的过程不要过度加重参与者负担。
完全没有失访是不可能的。不必过于强调无法克服的困难,研究者应该更努力以提高随访率(Panel 2)。
怎么样的失访率是可以接受的?只有一个答案,0%,这样才能保证随机化的效力(benefits)。
- 很明显,很多时候这是不现实的。
- 有的研究者建议使用5和20准则(five-and-20 rule of thumb)
- 失访率小于5%偏倚较小
- 失访率大于20%会严重影响试验内部真实性
- 5%-20%之间导致中等程度的问题
- 通过用最差的情况作敏感性分析,他们提出当失访率超过20%时,试验的真实性难以成立,我们对此也表示同意。事实上,有些杂志拒绝发表失访率超过20%的研究。
- 虽然5和20准则很有用,在那些结局事件较少的情况下,它会使问题过于简单化。
对失访率的估计依据很多因素:例如研究所需的检查项目、结局事件的发生率、随访的时间长度。
- 例如,如果研究者研究的是在医院生产的妇女产后第1天内的结局事件,那没有人会失访。
- 如果研究者研究的是非洲妇女(她们常常没有手机和住址)使用杀微生物制剂来预防艾滋病传播的情况,并随访一年,我们预期5%〜15%的失访率,虽然希望失访率更低些。实际上,在这种情况下,很多研究者的失访率更差,但近期不懈的努力使失访率降至1.5%左右。
另一条准则是不要让失访率超过结局事件的发生率。
比失访率的绝对值更重要的是两组之间失访率的差异。
- 研究者应该分析两组失访率差异。如果失访与不快或不适感、毒性、或治疗有效性有关,会产生偏倚。
在任何情况下,研究都应该记录并分析失访者的数据到失访的那个时间点。
Panel 2:增加随访率的方法
- 雇佣人员管理和跟进随访;
- 如果受试者没有回来随访,雇佣一组人员打电话或拜访受试者家中或工作单位;
- 在随机化分组前剔除可能不愿参加随访的受试者;
- 在随机化分组前剔除可能会离开居住地的受试者;
- 获得受试者的联系方式(如受试者、不与受试者住在一起的受试者亲朋好友、受试者家庭医生的信箱、电话、电子邮箱等),如果受试者没有参加随访,促使他们参加随访,或者便于重新找到该受试者;
- 获得受试者的身份编号,如国家医保号码;
- 为受试者而不是为研究者和试验执行者挑选便利的地点(除了中心诊所、医院外,挑选更多的地点,邻近受试者的居住地,易到达,关注受试者在随访时等待的时间);
- 随访时使试验流程流水线化,快速完成每一次随访;
- 让数据收集的过程尽量简短到不增加受试者负担的范围内;
- 提供优质免费的医疗服务;
- 提供资金资助,特别是受试者用于交通的时间和花费
九、结论
- 研究者应尽量减少随机化过程之后剔除受试者并采用意向性分析。
- 同时遵循CONSORT指南(CONSORT statement)声明来报道研究。
- 流程图或试验档案(flow diagram/trial profile) 可以帮助记录试验参与者的去向和结局。
- 对于读者而言,不报道剔除情况令结果难以解释,剔除的悖论误导读者对试验质量的理解。对剔除错误的处理可以造成方法学上的困难。
- 遗憾的是,对这些方法的解释又很有吸引力,从而掩盖了问题的严重性。读者必须同时与不充分的报道和他们的直觉相斗争,以发掘那些有损真实性的潜在危害。