0%

临床研究基本概念:随机对照试验(三)

说明:
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

随机试验中的分配隐藏:对抗破译(defending against deciphering)

一、摘要

  1. 恰当的随机化有赖于充分的分配隐藏。分配隐藏程序使得临床医师和受试者不知道下一例的分组情况。没有它,即使已经生成了恰当的随机分配序列也可以被推翻。
  2. 随机对照试验至关重要的无偏倚性质常与实施分配隐藏的过程中遇到的麻烦产生冲突。
  3. 恰当执行分配隐藏给研究实施者增添麻烦,这会让临床医师感到不高兴。随机对照试验对临床医师而言是一个诅咒。许多参与试验的人会试图破译分组的序列,这一行为违反了随机化。
  4. 对于一些实施试验者而言,破译分配序列经常成为一项无法抗拒的智力挑战。无论他们的动机是单纯的或恶意的,这种意图都损害了试验的有效性。
  5. 事实上,不充分的分配隐藏通常会导致高于预计的治疗效果,但偏倚在两个方向上均可出现。
  6. 试验研究者会竭尽所能地努力破译分配序列,因而试验设计者必须在设计试验时也努力聪明地防止破译发生。
  7. 研究者们必须恰当运用分配隐藏以有效地避免选择和混杂偏倚。
  8. 此外,研究者应报告有关重要预后变量的基线比较。
  9. 然而基线特征的假设检验是多余的,并且,如果其导致研究者回避报告任何的基线不平衡则可能是有害的。
  10. 医学研究会认为关于使用链霉素治疗肺结核的对照试验是里程碑的原因,并不像通常所认为的那样只是由于应用了产生分配顺序的随机数字表,更是因为其清晰地讲述了用来向所有参与入选病人的人员隐藏分组顺序的防范方案。

二、前言

生成一个不可预测的随机分配序列是随机对照试验中第一个最重要的随机化要素。实施这个序列,至少要到患者被分配至各自的组之前保持其隐藏即分配隐藏(allocation concealment)是第二个最重要的元素,如果缺乏分配隐藏则试验中的随机化就会崩溃。

作为随机化的一个直接结果,许多随机对照试验的报告中的第一个表格描述了各个比较组之间的基线特征。研究者们应该描述他们进行试验的人群并提供各组之间的基线资料的对照以使得读者评价其可比性。本章我们着重阐述恰当进行分配隐藏和基线特征报告的方法。

三、分配隐藏

研究者对分配隐藏有很多的错误概念。恰当的分配隐藏是严格执行某一随机分配序列而预先不知道分配治疗方案的保障。分配隐藏与实施分配序列的技术有关,而与生成分配序列的技术无关。然而有人在讨论分配隐藏的时候会离题万里地说到拋硬币法(flipping coins)或使用随机数字表(use of random number tables)。这种离题的讨论完全是方法学上的前言不搭后语;分配隐藏和序列生成完全不同。此外,有的研究者会将分配隐藏和隐藏治疗方案混淆起来。

没有充分的分配隐藏,即使随机化了,不可预测的分配序列也会被损坏。按照现有的关于预后的观点,有的患者可能会被分配到被认为不适合的治疗组,如果事先知道下一个分组方案,有的研究者会因此而排除这个患者入组。同样地,预知下一个分组也可以将某些受试者分配至所认为的合适的组,这很简单,通过推迟受试者入选直至下一次合适的分配出现就行了。防止预知如何分配治疗方案可以避免这些偏倚。分配隐藏防止那些招募入组受试者的人知道随后的分组。必须在不知道后续分组的情况下决定纳入或拒绝一个受试者并且获得知情同意书。

(一)分配隐藏的重要性

  1. 分配隐藏做得不好的试验倾向于夸大治疗效果。此外,隐藏得最差的试验在结果中产生更大的异质性(即比起做得好的研究,差的研究试验的计算结果明显上下波动)。这些有试验依据的证据证实了不充分的分配隐藏致使试验中出现偏倚。

  2. 事实上,缺乏充分的分配隐藏的话,不管有没有一个随机(不可预测)序列都没什么不同了。假定研究者们用随机数字表生成一个合适的分配序列,但是,之后他们将这个序列贴在一个告示板上,于是任何一个参加此试验的人都能看到随后的分组。类似的事情还有通过将方法指导卡片(method indicator cards)放在一个半透明的信封中来实施分配顺序。拿着这个信封对着亮着的灯,这个不充分的分配隐藏程序就很简单地被破译了。有了告示板和信封,负责纳入受试者的人可以察觉到随后的治疗分组,随即将有较好的预后的人分至试验组,而预后较差的人分至对照组,反之亦然。即使有了合适的随机序列,试验中也易出现偏倚。

  3. 研究者因此应确保在随机设计中有合适的序列生成和充分的分配隐藏。这两方面的任意一个错误都将损害随机化,导致不正确的结果。例如,某试验的结果显示一种治疗的效果更好,然而这其实仅仅反映了分配过程的偏倚;或者试验显示无效而实际上治疗效果是有害的。此外,这种试验的结果可以比一个明晰的观察研究所得出的类似结果更有毁坏性。人们常假定并能意识到观察性试验中有偏倚,统计分析和最终阐述时会对此加以考虑。相反地,贴着随机化标签的研究经常被认为是没有偏倚的,而不充分的报告通常会掩盖它们的不足。

  4. 随机对照试验的可信度(credibility)为临床和预防管理中更快更大程度的改变提供支持。如果不是基于最好的研究,结果则会是浪费有限的健康资源,甚至更糟的是会损害人们的健康。因此,随机对照试验的(well-deserved)的可信度产生了间接的责任。不恰当的随机试验很容易造成错误判断。

(二)破译的各种情况

  1. 有试验依据的研究发现提示研究者有时候会破坏随机化,尽管他们几乎不记录这些颠覆。无论如何,当研究者不记名地在流行病学研讨会上回应质疑的时候,常常涉及分配设计被破坏的例子。
  2. 此类例子的不同个案描述了从简单到复杂的操作范围。大部分分配隐藏设计被研究者破译是因为其方法不够充分。例如:
    • 或是贴在告示板上。
    • 或是拿着半透明信封对着灯光可见而解码随后的分组,然后,研究者们就可以改变入组或将受试者分配至特殊的研究组。
    • 有的则是打开未封口的分组信封,感觉信封的不同重量或者简单地打开未编号的信封直至他们找到某种想要的治疗方案。
  3. 研究者们破译一个较好的分配隐藏设计则比较困难。然而,实际上总会有人描述其最终智取(破译)了某个方案。
    • 比如,某些医生依次拿着编号的、不透明的、封口的信封在放射科对着热灯(一种非常明亮的白炽灯泡)以试图破译分组。
    • 在使用中心随机化的研究中,试验研究者通过电话向中心一次性索要其后几个人的分组,他们至少在一两种情况下能得到分组顺序。
    • 在用依序编号的药物容器的试验中,有人依靠容器标签的外表来破译分组。
    • 有人在半夜看见某个主治医师为了寻找分配列表搜遍了办公室里的主要研究者的文件,于是她放弃了通过容器的外包装解码的方法。她首先想到的是:这个主治医师可真聪明!鉴于她在方法学上的天真和无知,她没有意识到这种行为会导致试验的偏倚。
  4. 尽管研究者理论上明白研究需要无偏倚,可一旦他们加入某试验有时会无法保持无偏倚。研究者可能希望某些病人从某种治疗中获益,或试验结果能证实他们的想法。恰当完成的随机对照试验的程序会阻止这种临床倾向性,因而致使研究者进行试验时感到困扰。
  5. 有的科学家的目的是蓄意破坏他们的结果。然而,许多破译随机序列的意图直接表现出缺乏对这一行为科学后果的认知。此外,对于有的人,破译分配设计可能常常是一个无法抗拒的巨大的智力挑战。如Oscar Wilde所写,“消除诱惑的唯一方法是向其屈服”。然而无论他的动机纯洁与否,这种意图损害了试验的有效性(validity)。
  6. 研究者必须认识到人性中的好奇心,设立方法学的安全防范,恰当的分配隐藏无形中会阻止对随机化的破坏,在实际中使试验避免选择和混杂偏倚。
  7. 设计恰当的分配方案要花时间、精力和思考。在全面地检查最后方案前,研究者不应该开始委派任务。研究实施者会竭尽所能地破译分配序列,所以试验设计者必须在设计试验时也努力聪明地防止破译发生。

(三)用分配隐藏寻找什么?

  1. 研究者认为按下列方法进行分配隐藏是充分的:

    • 顺序编号(sequentially numbered)
    • 不透明(opaque)
    • 封口的信封(sealed envelopes,SNOSE)
    • 药房控制
    • 编号或编码药物容器
    • 中心随机法(例如电话告知研究办公室)
    • 或其他描述分配隐藏:如一个可靠的计算机辅助方法。
  2. 这些标准建立了最简单的方法学标准,但仅约1/4的试验符合标准。通过从已发表的报告中评估分配隐藏,读者会很容易明白如何合理达成这些标准(Panel 1)。不过毫无疑问,那些最简标准是能被超越的,如果研究者提供的描述不仅结合了最简标准且有其他更严格标准的元素,读者更能相信试验已经防止了选择和混杂偏倚(Panel 2)。

  3. 信封分配隐藏方法较其他的方法更易怀疑被人巧妙地操纵,因而并不理想。如果研究者使用信封法,他们应严谨地设计并监察(monitor)分配过程以确保序列隐藏。除了使用顺序编号、不透明、封口的信封外,他们应确保事先给信封编号,且只有在相应的信封上写上受试者姓名和其他细节信息之后才能按编号顺序打开之。我们也推荐在信封内面使用压力复写纸或碳纸,以便上述信息能留在分配表上,从而建立一个有价值的印迹用于稽查。在信封里放硬纸板或铝箔可以进一步避免通过热光源探知分组。

  4. 药房环节也可以造成分配隐藏和序列生成的困难。尽管提到由药房进行分组的报告通常已经被归入“此试验已经使用了一种可接受的分配隐藏机制”的范围内,但药剂师在试验中恰当地应用随机法的依从性如何并不清楚。

    • 研究者应该报告所采用的预防措施。我们知道药剂师违反分组时间表的例子。
    • 比如:一个大药房每随机分组一个受试者可以获得150美元。在试验期间,某一周末之后,这家药房用完了两种比较药物中的一种,因此将所有新入组的受试者都分配至另一个药物组,以避免减慢入组速度。而另一家药房则用交替分组来随机化患者。研究者不应该假定药剂师和其他试验实施者都了解随机对照试验的原理,研究者必须确保他们的研究搭档坚持执行恰当的试验程序。在最简标准外,如果研究者说明他们知道或核查药房的分配机制,读者能对其结果更有信心。
  5. 使用连续编号容器可防止预测治疗分组,但是这只有在研究者采用了适当防范下才成立。除最简标准外,报告的作者们还应该说明防范措施的进一步细节,确保所有的容器是防止拆封篡改的、等重的、外观相似的,并且建立某些稽查轨迹(如在空瓶或者容器上写受试者的姓名),这些可以帮助读者评估是否随机化已经被成功隐藏。同样地,尽管中心随机化是一种优秀的分配隐藏方法,仍需建立并执行有效的试验方法。研究者们至少应该说明联络的方法(如:电话、传真、电邮),保证在随机化之前入组受试者的严格程序,且全面地训练中心随机办公室中的每个人,所有的细节在做试验和写试验报告时都要被考虑到。

  6. 其他的方法也可能满足足够的分配隐藏。读者应该寻找描述中关于隐藏的可信成分。如:可靠的计算机辅助方法可以通过保护分组信息直到保证和确认入组而做到分配隐藏。确实,自动分组系统可能会变得更常见。但是,一个仅贮存或单纯地保护分组信息的简单的电脑系统,会变得透明得如同把随机化表贴在公告板上一样。在描述一个分配隐藏方法时,研究者应展示分配隐藏背后的原理及它们是如何达到标准的。

  7. 研究者在报告中经常未能对分配隐藏进行哪怕是最少的描述,致使读者不能评估随机对照试验。幸运的是,自从更多的医学杂志开始采用随机对照试验的报告标准,情况开始在改善。此外,由于发表研究报告的促进作用,更多的研究者将能够设计和实施更好的试验。

  8. Panel 1(描述分配隐藏):

    • “……将药物分配和编码的数字结合起来。每10个数字的区组从一个中心办公室被寄至每个中心随机化负责人。这个人(药剂师或护士,不参加受试者诊疗且与此中心的研究者无关)负责分配和准备,并负责试验输液。试验输液在另外一个不同的中心准备好,每24小时送给床旁护士,护士按合适的速率给患者输液。因而随机化顺序对所有的护理工作人员、病房医生和其他试验者都隐藏。”

    • “……隐藏于顺序编码的、密封的、不透明的信封中,并且由两个中心的医院药剂师保管。”

    • “治疗方案由中心证实入选标准正确性后电话分配……”

    • “由Glenfield医院药剂科进行随机化,分配研究药物并持有试验码,这些都会在研究结束后揭盲。”

    • “不同的安慰剂和治疗区组由一个药品号标识(medication number),然后按某一顺序分发给患者。此随机名单准备了两份,一份由包装部门使用……提供泡罩包装(blister packs)的20粒胶囊供10天的早晚服用。这些泡罩分装放在有标签的盒子里。例如:每个患者的每剂量药物放在一个盒子里。

      泡罩包装:又称铝塑包装或水泡眼包装,常用的药物包装方法之一

    • “个体由计算机产生的名单随机化,集中保存,没有哪个中心知道任何患者分配的治疗方案。每个患者被分发有标志的容器和一个额外的容器盒,以供中心医生需要开处方增至15mg或20mg的西布曲明或安慰剂时使用。”

  9. Panel 2(最简及拓展标准:充分的分配隐藏设计)

    关于充分的分配隐藏设计的最简描述 附加描述提供更好的保证分配隐藏的措施
    顺序编号,不透明,密封的信封(SNOSE) (1)将受试者的详细信息写在信封上之后才可以依次打开信封;
    (2)信封内面的压力敏感复写纸或碳纸可以将信息转录到分配卡上(形成监察痕迹);
    (3)信封内放硬纸板或铝箔使得信封在强光下不透明 (不透视)
    顺序编号的容器 所有的容器都是防止拆封篡改、等重、外观相似的
    药房控制 (1)文章中表明是由研究者设立、验证或者至少是批准的给药房的一个恰当的随机化方案;
    (2)文章中表明研究者指导药房进行恰当的分配隐藏
    中心随机化 联系方法(如:电话、传真、电子邮件),严格的程序确保在随机化前入组,以及对中心随机化办公室的每个人全面培训

四、基线比较(Baseline comparisons)

(一)基线特征表格

  1. 尽管随机化避免了系统偏倚,但这不一定就会产生在预后因素方面完美平衡的分组。干预组间仍留有机遇所致的差异(如:机遇分配不均)。不过统计检验可以解释机遇差异。随机化的过程是显著性检验的基础,并且无论预后因素是已知或未知的,随机化的过程都和预后因素无关。

  2. 无论如何,研究者应该在一个表格中按照治疗组别展示基线特征。这些信息描述进行试验所在的假设人群,且让读者看到外推至其他人群的可能性。此外,它让医师将结论推论至特定的患者。

  3. 基线特征表格也让读者们比较试验各组在基线时重要的人口学和临床特征。然而,我们通常会不适当的使用假设检验(如表中的P)去比较我们所关注的特征。这些检验测定观察到的差异可能是因机遇产生的可能性。但是,在恰当的随机试验中观察到的差异按定义来说都是因机遇产生的。如Altman所言,“这个程序明显是多余的”。

    特征 抗生素组(n=116) 安慰剂组(n=129)
    年龄(mean [SD]) (years) 30.2 (5.2) 31.1 (5.9)
    体重(median [25th,75th centiles]) (kg) 141 (122, 181) 144 (123, 188)
    未产妇(number, %) 62 (53%) 63 (49%)
    既往盆腔炎(number, %) 24 (21%) 28 (22%)
  4. 对基线特征的假设检验不仅是不必要的,可能还是有害的。

    • 研究者用假设检验比较基线特征,报告的显著结果比预计由机遇产生的差异要少。
    • 关于这种差别的合理解释是:有的研究者可能决定不报告显著的差异,因为他们相信隐瞒了这个信息,能够增加他们报告的可信度。
    • 假设检验间接导致研究者们隐瞒基线不平衡,因而其除了是多余的,也是有害的。

(二)基线特征关注什么

  1. 研究者应该报告关于重要预后变量的基线比较。读者应该在考虑所测得的变量预后强度和已经产生的机遇不平衡的程度的基础上观察各组的可比性,而不要根据基线的统计学显著性检验考虑组间的可比性。
  2. 上面的表格提供了有效的格式来陈述基线特征。
    • 对于连续变量,如年龄、体重,研究者应用一个均值和一种检测变异度(variability)的方法,通常是平均值和标准差来描述。
    • 如果数据分布不对称,用中位值和百分位数范围(即四分位数间距)来描述更好。
    • 变异度不应该用标准误和可信区间来表述,因为它们是推断而不是统计描述。
    • 数目和比例用于报告分类变量。
  3. 在分析中,对于结局的统计检验说明了任何的机遇所致的不平衡。然而控制机遇不平衡,例如恰当地计划并实施试验,也许能产生一个更精确的结果。研究者应该陈述任何校正过的分析,并描述他们如何以及为何校正该协变量。

五、结论

  1. 恰当的随机化仍是避免选择和混杂偏倚的唯一方法。
  2. 事与愿违地是,随机对照试验重要的无偏倚性质与其在实施中令人厌烦的问题同时存在。
  3. 随机对照试验阻止了人们的临床倾向,因此如果有机会破译分配方案,许多参与试验的人会试图破坏随机化。
  4. 为了将人们的这种倾向控制到最小,试验者必须非常注重隐藏分配方案。
  5. 恰当的随机化与充分的分配隐藏密不可分。