说明：
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

队列研究：迈向结局

一、摘要

队列研究将特定人群分两组或多组，从暴露到结局的方向进行研究
该研究方法可以以现在为观察起点随访至将来某个时间点（前瞻性队列研究)。也可在过去的一个时间段里面确定一个队列，观察到现在为止（回顾性队列研究)。
队列研究是明确疾病发病率及其自然史的最佳方法，还可用于研究由单一暴露因素导致的多种研究结局。但是该研究方法不适于检测罕见病及潜伏期长的疾病。
队列研究对暴露和结局应有明确定义：该定义应尽可能客观。
对照组（非暴露组）除了无暴露因素之外，其他各主要方面均应与暴露组相似。而这种相似程度在观察性研究中几乎无法达到，因此研究人员需要检测并控制各种混杂因素。
处理失访问题是研究中的一大挑战，因为差异性失访会带来偏倚。
在队列研究的框架下面还有多种不同的研究方法，如前后对照研究法和巢式病例对照研究法(研究限于队列内)。
队列研究的优势在于计算发病率，相对危险度和95%可信区间（CI)，这种方式较之仅给出P值，能更好地表达研究结果。

二、队列研究的分类

队列（cohort)这个词起源于军事，而非医学。
- 一个队列指的是罗马军队中一个步兵大队，由300-600人组成。
- 10个队列组成一个军团(legion)。
该词的词源告诉我们一个很有用的概念：队列研究(cohort study)由一群或一组人群组成，在时间方向上从暴露迈向结局。
队列研究的同义词：
- 发病率研究(incidence study)
- 纵断面研究(longitudinal study)
- 前瞻性研究(forward-looking study/perspective study)
- 回顾性研究(prospective study)
- 随访研究(follow-up study)
- 并行性研究(concurrent study)
队列研究是随访两组或多组人群从暴露到出现研究结局。
- 最简单的队列研究是将暴露于某种因素的暴露组和非暴露组进行对照。如果暴露组出现研究结局的发生率高于或者低于非暴露组，则可据此认为该因素与该结局之间存在联系。
所有队列研究方法的最主要特点就是研究人员沿着从暴露到结局的时间轴来随访研究对象。

（一）前瞻性队列研究(perspective/concurrent cohort study)

以现在为观察起点。
例如，对于辅助生殖技术引起的多胞胎生育的流行病学研究。研究人员随访一组通过辅助生殖技术受孕的孕妇和一组通过自然受孕的孕妇，比较两组多胞胎的发生率。

（二）回顾性队列研究

从过去的某个时间点开始选定队列。
例如，研究人员也可以利用现有的病历档案，上溯几年将孕妇分为暴露组和非暴露组。然后，追踪病历档案确定其生育的情况(研究结局)。

（三）双向性队列研究(ambidirectional cohort study)

顾名思义，资料收集是双向的。该方法可用于暴露因素作用后可能会既有短期效应又有长期效应的研究。
例如，辅助生殖技术也许与多胞胎生育有关，也可能与多年后卵巢癌有联系。因此，研究人员会追溯研究对象的多胞胎生育的病历档案，也会随访这些妇女今后卵巢癌的发生情况。

三、队列研究的优点

是获得疾病发病率(incidence)及了解其自然史(natural history)的最佳方法

通常，假定的病因与结局发生之间的时间先后顺序明确：研究开始时，无论是暴露组还是非暴露组均未出现研究结局。而横断面研究和病例对照研究对于像先有鸡还是先有蛋这类问题却常常无能为力。
队列研究法可用于单一暴露因素下可能发生多种结局的研究。典型的案例就是研究吸烟(暴露)与中风、肺气肿、口腔癌、心脏病(研究结局)的关系。
- 但该“优点”常被滥用。例如，在暴露和许多结局的关联上都做过统计学检验，但是仅仅报告具有统计学意义的关联，因而引起误导。
- 合理的做法是，研究人员应该在研究计划中事先就明确研究的主要和次要联系，或称之为“假设确认(hypothesis confirmation)”。即使研究人员在实验中可以去检验暴露和其他结局之间的联系，或称之为“假设产生(hypothesis generation)”，他们也应该在报告中列出所有的检验结果，而非仅仅报告具有统计学意义的发现，这样读者就能够正确看待这些结果了。
队列研究同样也适用于罕见暴露的研究：研究人员可以在特定的工作场所招募暴露在罕见因素(例如电离辐射或化学药品）下的工作人群。医院或工厂可以提供大量暴露于特定研究因素下的个体，在普通人群中暴露在这些特定因素的人非常罕见。暴露与否并非为研究人员所定，所以不涉及伦理的问题。
队列研究还可以减少生存者偏倚(survivor bias)。生存者偏倚常常让快速致命疾病的研究变得困难。
- 例如分析铲雪和心肌梗死之间的联系，如果采用基于医院的病例对照研究的方法，就会遗漏所有死于途中的心肌梗死患者。而队列研究则是一种偏倚较小(但工作量较大)的方法：按是否铲雪将人群分为两组，比较其心肌梗死的发生率。
队列研究可以计算：
- 发病率(incidence rates)
- 相对危险度(relative risks)
- 可信区间(confidence intervals)
队列研究的其他结局指标还包括：
- 寿命表率(lifetable rates)
- 生存曲线(survival curves)
- 风险比(hazard ratios,HR)
- 而病例对照研究无法直接计算发病率，仅当发病率很低的情况下，比值比(odds ratios,OR)很接近相对危险度。

四、队列研究的缺点

队列研究中选择偏倚几乎是与生倶来的。例如，如果进行慢跑锻炼和心血管疾病的关系的队列研究，应当考虑到会进行慢跑锻炼的人在其他重要因素(如饮食和吸烟习惯等)上也会与不进行慢跑锻炼的人不一样。理论上来讲，两组之间除了所研究的暴露因素(慢跑锻炼)之外，其他重要方面都应该相似，但实际上这种理想状态几乎不会发生。
队列研究也不适用于罕见疾病(如硬皮病)或潜伏期很长的疾病(如肿瘤)。不过几个大型的(当然也是昂贵的)队列研究为我们认识一些少见病的特点作出了突出的贡献。这些研究包括：
- 皇家全科医师学院(Royal College of General Practitioners)的口服避孕药研究
- Framingham心血管疾病研究
- 护士健康研究/the Nurses Health Study
- 英国医生研究/the British Physicians’Study
失访是很棘手的问题，即使只是失访一个月。暴露组和非暴露组差异性失访可使得研究出现偏倚。
随着时间延续，研究对象的暴露状态可能发生改变。
- 例如，使用口服避孕药的妇女可能转为使用宫内避孕器具，或者相反。
- 研究者可能需要分区(Partitioning)避免暴露因素的模糊化/或有时称之为“污染（contamination)”。

五、队列研究中时间-事件结局关系(time-to-event)的报告

（一）生存分析（Survival analysis)

生存分析适用于当研究对象随访时间长短不一时，或者当研究对象在不同时间点进入研究时。
相对于把结局做简单的二分类变量处理，Kaplan-Meier method能更好地表达在时间维度上各个时间段结局发生的危险度。
- 该方法可以确定任意时间点上结局发生的可能性(概率\(P\))。
- 分析结果以阶梯函数的曲线图表示(每发生一个结局，曲线进入下一个阶梯)。
- 互补的镜像阶梯图，即Kaplan-Meier生存曲线(Kaplan-Meier curve)，则表现每一个时间点上不发生结局的概率(\(1-P\))。
- 对数秩检验方法(log-rank test)可以进行生存曲线的组间比较。

（二）比例风险模型（Proportional hazard model)

处理不同随访时间的另一种方法是Cox比例风险模型分析法(Cox proportional hazard model)。
这是一种引入多变量的分析方法，其因变量是时间-事件结局(如疾病)；而多元logistic回归的因变量是“是/否”类型的二分类变量。
该模型得到的回归系数可用于计算校正模型中其他变量后出现结局的风险比(risk ratio,hazard ratio)。这里的风险比(及其95% 可信区间)的意义与二分类结局变量的相对危险度(relative risk)相仿。

六、队列研究的要点

（一）谁是潜在患病者？

队列研究的所有研究对象(无论是暴露或是非暴露组)均应是潜在的患病者。
举例来说，进行过输卵管结扎术的妇女几乎不会罹患输卵管炎，因此如果要开展盆腔炎的队列研究就不应将其列入研究对象之中。

（二）谁是暴露人群？

队列研究需要在研究之初即明确的、无歧义地确定暴露因素的定义
有时候，其定义不仅仅是要区分“有或无”暴露，还要将暴露进行定量。如最低暴露剂量可能定义为每天14支或低于14支香烟，或者3~6个月的口服避孕药。这样来定义暴露的结果就是：研究的组别可能会超过2个组(如非吸烟组，轻度吸烟组和重度吸烟组)。

（三）谁是合适的对照？

最关键的一点就是除了不在暴露因素之下，对照组(非暴露组)在各个重要的特征上均应和暴露组相似。如果这样的话，非暴露组可以提供所研究结局的基础发生率的信息(the background rate of the outcome in the community)。
非暴露组可以是“内源性”的(相同的时间和地点的人群，如同一个病房)，也可以是“外源性”的。
内源性者更为可取。在一个特定的人群中，个体会自动(或者因为医学干预)按一定暴露因素(如吸烟、职业、避孕等)分类聚集。
- 例如，在一个队列研究中纳入了138个HIV-1相关性Kaposi肉瘤的患者，并将其分为口腔病灶和皮肤病灶2组。出现口腔病灶(暴露因素)的预后更差，其中位生存时间(结局变量）仅为另一组的1/3。
如果没有合适的内对照，也可寻找外对照，有时候称为“双重队列研究(doublecohort study)”。对于职业性暴露的研究，在同一个工厂中要找到足够的非暴露对照有时候很困难。这时候可以选择同一社区类似的工厂工人作为对照。这样做的前提是假设其他工厂工人和暴露组工人在所研究结局上的基础危险度是相同的，但这个假设往往不一定成立。
更逊于前两种对照方法的是使用普通人群资料(population norms)作为对照，例如疾病特异性的病死率(disease-specific mortality rates)。
- 研究者可以比较工厂工人和同年龄同性别普通人群的肺癌病死率。
- 不可避免的“健康工作者效应”（healthy worker effect)会导致这样的比较出现偏倚：工作者通常要比不工作者(或者不能工作)更健康。而且，工作带来的福利待遇和经济收入可能会进一步增加偏倚。

（四）结局评定是否公平公正？

结局的定义也必须事先明确：其定义必须清楚、特异，并且可定量。
为避免信息偏倚，在暴露组和非暴露组中评定结局必须公正。如果不能很好地、客观地定义结局变量，研究结果也无从解释。
- 这不单单是指一些以主观感觉为主的综合征如海湾战争综合征、慢性疲劳综合征，以及经前综合征。
- 对于更多的普通疾病如子宫内膜炎等也是一个挑战。how tender must a uterus be？
对于队列研究中的主观性结局(如疼痛、皮肤红斑等)，评定者应该不知道研究对象暴露与否，即盲法(blinding)，这非常重要。
而对于客观性结局(如发热、死亡等)，盲法则相对不是那么重要。
关于结局的信息可以有多种来源。
- 病死率的研究常采用死亡证明(death certificate)等。
- 对于非死亡的结局，信息来源可以是医院病历，保险记录，实验室检查结果，疾病登记系统，出院记录，以及体检和测量资料等等。
- 最佳的做法是，评定结局的研究人员应该不知道研究对象的暴露状态。如果诊断不是那么明确，可以加上一些修饰词，如确诊，可能或可疑。

七、随访

失访是否最小化？

（一）失访的影响

一般来讲，失访(loss to follow-up)会削弱研究的把握度(power)和准确性(precision)，其中差异性失访尤为甚者。
中途退出（Bail-outs)并非随机事件。如果研究对象中途退出的原因与暴露和结局皆有关系，这就会导致偏倚。
- 例如一种新的抗生素可能导致很差的结果，因此研究对象无法完成问卷或者回来复查。他们从队列中的退出失访会让研究结果看上去显得这个新抗生素比其实际效果要好。

（二）处理失访

处理失访的最好办法是避免失访。例如，将参加者限制为那些可能会完成随访的人。
另外，一些方法也常用于保证随访的进行。
- 在研究开始时，可以取得几个不与研究对象住在一起的家庭成员或者朋友的姓名，或者知道他的家庭医生。如果研究对象搬家了，这些联系人员可能会知道他的新址。
- 机动车登记资料也会有些帮助。
- 国家死亡统计登记系统，如美国国家死亡人口索引(the National Death Index in the USA)等也可帮助记录随访资料。
- 研究对象因为参加研究可能会损失工作时间，可以给予一定的经济补偿。
努力地追踪随访研究对象是一项很累的工作，可以单独雇人从事这个任务。

八、队列研究报告所需展示的要素

有多少选择偏倚？
- 是否只包括潜在的患病者？
- 暴露的定义是否清楚、特异，并且可以定量？
- 除了暴露状态之外，暴露组和非暴露组在其余各主要方面是否都相似?
采用了哪些方法去减少信息偏倚？
- 结局的定义是否清楚、特异，并且可以定量？
- 暴露组和非暴露组是否用相同的方法来评定结局？
- 评定结局是否采用盲法？
两组的随访是否完整？
- 用什么方法来减少失访？
- 两组失访情况是否相仿？
是否查找并在数据分析中校正潜在的混杂因素？
- 研究者是否考虑并收集潜在混杂因素的信息？
- 采用什么方法来评估和校正混杂因素？

研究人员首要的挑战就是让编辑(然后是读者)相信：暴露组和非暴露组除了在暴露状态上这一点之外，其余各主要方面都确实是非常相似。因此，研究报告的第一个表常常应该提供暴露组和非暴露组的基本人口学和其他预后因素资料，以及其假设检验(hypothesis testing)来显示所观察到的差异有多大的可能性是巧合所致。

对于二分类的结果变量(如健康或患病)，研究者应该提供一定的原始数据，便于读者自己确认结果。对于累积发病率(cumulativeincidence)，研究者应该计算在研究期间出现结局的研究对象所占的比例。发病率的分母以单位时间来表示，还需要提供相对危险度和可信区间。P不能取代区间估计(即相对危险度和可信区间），只能用做补充信息。

九、特殊的队列研究方法

（一）前后对照（时间续贯）研究[before-after(time series) studies]

研究者测量和比较受试者干预(通常是用药）前后的检测指标。
这种做法存在一些问题：
- 首先，忽视了“趋均数回归效应”（regression to the mean)。如果在第一次检测时得到一个特别大的测量值，例如有一个较高的实验检测值，那么无论治疗与否（或者治疗是否有效），在随访的时候多数会得到较小的均值。
- 其次，客观环境的变化可能会对检测产生影响，例如季节变化和肺炎发作的频率有关。
- 再次，如果在第一个阶段给药，则在进行第二阶段观察前还应空出一个洗脱期(washout periods)以消除药物延滞效应(carryover effect)。

（二）巢式病例对照研究/Nested case-control studies

为何研究者要在队列研究过程中挖掘出一个病例对照研究呢？因为有些暴露因素或者预测因子检测费用非常昂贵，例如有些复杂的血液标本检测。如果队列中每一个人都进行检测就不够经济。比较经济而明智的做法是开展一个能产生足够病例的队列研究。所有受试者入组时采集一份血液标本，血清冻存至研究结束。在研究中出现所期望结局的所有研究对象成为巢式病例对照研究的病例。研究者再在未出现结局的受试者中随机选取对照。接下来，研究者只需要检测病例和对照的血清标本，而非队列中所有暴露和非暴露的受试者。这样，实验室检测费用会大大减少，而同时保证暴露因素(如阳性的实验室检测结果)也是在出现结局之前即存在。通常，选取对照时在一些重要因素上(如年龄和性别)也会做配对。

十、结论

队列研究在医学研究中十分常见。和其他研究设计一样，这种方法也是优缺点并存。
读者应该弄清楚研究者报告中是否提供了关于暴露和结局的清楚、特异和可定量的定义。
非暴露组和暴露组在各主要特征上应该相似
结局的评定应该尽可能客观，如果有可能的话，采用盲法。
对于二分类的结局变量，研究者不但应该提供率、相对危险度，还应该给出可信区间，这样比仅仅给出P值提供了更多的信息。
报告时还应该分析和描述偏倚可能对结果和结论产生的作用。
研究者还应该测量和控制潜在混杂因素，这一点非常重要。

高山流水

临床研究基本概念：观察性研究（三）