说明：
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

病例对照研究：反方向的研究

David L Sackett:he would trust only six people in the world to do a proper case-control study.(世界上他相信只有6个人能做好合适的病例对照研究)

一、摘要

在众多研究方法中，流行病学家从病例对照的研究设计中获益最多。病例对照研究与其他研究设计相比，耗用的时间、金钱和精力都明显较少，但同样能产生重要的科学发现。这条“捷径”吸引了许多刚刚入行的流行病学家。
的确，在分析性流行病学研究中，研究者采用病例对照研究的次数要比其他研究都多。不幸的是，病例对照研究比其他类型的研究更容易产生偏倚。
病例对照研究容易做，却也容易做错。以下5点可作为开展、阅读和评估病例对照研究的指南。
- 首先，研究者必须清楚无误地定义病例的诊断标准和入选标准。
- 其次，对照组必须与病例组来源于同一人群，而且选择的对照应该独立于所研究的暴露因素。
- 再次，研究中的数据采集者应该不知道研究对象是否为病例；如果这一点做不到，最起码，他们不应该知道研究的主要假设。
- 第四，应该认真训练数据采集者，使之能用同一种方法从病例和对照中搜集暴露状态的信息；他们应该采用一些记忆辅助物以同等地帮助病例和对照回忆。
- 最后一点，无论是在研究设计之初还是在数据分析阶段，研究者均应考虑到混杂因素。
在所有的这些细节上的认真审慎会让研究结果更为可靠，也使得读者确信研究者的发现和结论。

二、基本的病例对照研究设计

这种研究设计是往回看的，因此这会困扰不少研究者和读者。例如在队列研究中，研究是按照暴露与否来分组的。而在病例对照研究中，研究则是按照结局来分组的。因此，如果研究吸烟和肺癌的关系，肺癌患者作为病例组，无肺癌者则作为对照。研究者回顾每一个研究对象的暴露状态(吸烟史)。因此该设计的性质是回顾性的。研究者比较病例组和对照组吸烟的频率，测定其联系强度(measure of association)。
和队列研究不一样，病例对照研究不能计算发病率(incidence rates)，而是根据病例组和对照组中具有暴露因素的个体的比例来计算比值比(odds ratio)。当目标人群中某一特定结局的发生率较低时(通常暴露组和非暴露都低于5%即可），病例对照研究得到的OR值非常接近相对危险度RR值。

三、病例对照研究的优缺点

流行病学家常常夸病例对照研究是省时、省钱、省力的最有效的研究设计。在发病率很低的时候的确如此，因为如果采用队列研究，研究者需要随访很多人才能得到一个会出现研究结局的受试者。同样，如果疾病具有很长的潜伏期(如癌症)，开展一个队列研究需要随访很多年才能等到研究结局的出现，而病例对照研究就显得很有效率了。
不过，有时候队列研究也会比病例对照研究更有效率。比如当人群暴露的水平很低时，病例对照研究的效率马上下降。研究者需要大量的病例和对照来找到一个具有暴露因素的人。例如在非洲的一些地方研究口服避孕药和HIV-1传播的关系，如果采用病例对照研究就不实际，因为该处使用口服避孕药的人几乎没有。经验法则是，如果研究结局的发病率高于暴露因素的存在水平，则队列研究会更有效率(the incidence of outcome is higher than the prevalence of exposure)。

四、选择病例和对照组

（一）病例组

理论上来说，人群中所有的病例都可以入选为病例对照研究中的病例组。但实际情况下常常只有一部分作为样本用于研究。
因此，研究者应该说明这个样本是如何选择的，提供关于研究结局的清楚的定义(如临床症状，实验室检查结果和诊断方法的选择)。
研究者也需要详细说明病例组的入选标准，如年龄范围，病例来源(诊所、医院、人群)等
病例最好是选择新发病患者[incident (new)]，而不是包括新老病人在内的所有患病者[prevalent (both old and new) cases]：因为诊断方法和模式会随时间而变化，因而新诊断的病人之间的一致性要比不同时期所诊断的病人来得好。

（二）对照组

对照组提供的是病例组的基础暴露水平预期值(the background proportion of exposure expected in the case group)。
因此，对照组应该是没有疾病(所研究的结局)而又具有很好的代表性：这里的代表性是指任何对照组的个体如果他患上这种疾病，他完全有可能入选病例组。简单来说，对照组应该代表可能会发展为病例的人群。
对照的选择应该独立于所研究的暴露因素。这是做好这个研究设计的精妙之处，它左右着研究质量的好坏。当研究者考虑去选择各种潜在的对照组时，他们必须想到所有可能会出现的潜在偏倚，这一步是流行病学中最为艰难的一个任务。

对照选择不佳导致偏倚的例子。

病例	对照选择	无代表性	选择偏倚
住院的大肠癌病人	因关节炎住院的病人	对照暴露于NSAIDs的概率很高	将错误地低估效应数值(OR)
住院的大肠癌病人	因消化道溃疡住院的病人	对照暴露于NSAIDs的概率很低	将错误地高估效应数值(OR)

有人采用病例对照的方法来研究非甾体类抗炎药(NSAIDs)是否能预防大肠癌。他们比较住院病人中大肠癌和非大肠癌患者之前NSAIDs的使用情况。如果对照组是来自于风湿科，研究就会出现偏倚，因为关节炎病人比普通人群中可能会出现大肠癌的那部分人群更经常使用NSAIDs类药物。对照组中NSAIDs的高频率使用会降低效应数值(OR)。而如果对照是来自于消化科，因为消化道溃疡病人往往从医生那里已经知道要避免使用非甾体类抗炎药，所以这个对照组NSAIDs使用频率非常低，故而会出现OR假性增高。换句话说，如果研究者没有独立于暴露因素之外来选择对照组，结果可能会出现两个方向上的偏倚。

为了减少选择偏倚，研究者可以在选择对照的过程中尽量减少一些主观臆断。如果病例组是来源于某个地区的所有病患，那么对照组应该是从相同地区普通人群中随机选取。
- 在一个研究乳腺癌和口服避孕药的病例对照研究中即采取了这个做法。所有20〜54岁，生活在美国8个区域中的新诊断为乳腺癌的女性组成了病例组；
- 而相同年龄，相同区域，随机电话号码拨号法(random-digit dialling)选择的女性则构成了对照组。虽然这提供了一个非常好的模板案例，但是这种实验设计并不是经常可行的。
阅读病例对照研究报告时，在没有核对“方法”部分描述的对照组是否合适前，不应该接受其研究的结果。
- 如果研究者对于对照组的选取语焉不详，则其结果非常可疑。
- 着重要看研究者提供的关于对照组的代表性，以及选取对照组是否独立于所研究的暴露因素。这需要花费时间和力气，但这是病例对照研究的关键所在。

五、暴露因素的测量

（一）难点

受试者中无论是病例还是对照，都有可能记不清楚以前的暴露情况，尤其是很久以前发生的暴露。而且与对照相比，病例往往会对一些被认为可能与结局有关的暴露因素记忆更为深刻。这种回忆上的差异为回忆偏倚(recall bias)，即是一种信息偏倚(information bias) 。
瑞典有一个研究，研究者检验人工流产和日后发生乳腺癌之间的潜在联系。他们利用面对面交流和全国病史记录来收集病例和对照的暴露史(既往流产情况)。与明确的病史记载相比，在对照组中面对面交流时更多人不承认她们有过流产史。而病例组中无此情况。病例组和对照组之间关于暴露的不同回忆导致结果出现偏倚。

（二）解决方法

数据收集时产生的偏倚会带来更多的麻烦。如果数据收集者知道研究对象中谁是病例、谁是对照，他们可能在收集信息时出现不均衡，同样导致潜在的信息偏倚。
- 对于病例，数据收集者可能会去从研究对象那里发掘更多的关于暴露的信息；
- 而对于对照，则不会这么卖力。如果有可能，数据收集者(如面对面交流者等)应该不知道研究对象是病例还是对照。
- 如果盲法不能施行，他们最起码应该不清楚该研究的假设。
研究者还应该培训数据收集者以相同的态度和方法去获取病例和对照的信息。
为了减少信息偏倚，仅仅依靠从病史等资料中获取暴露的信息是不够的，因为很多情况下这些记录要么没有，要么不完全，不足以在数据分析中校正混杂因素。
病例对照研究的研究者必须随时考虑到研究中潜在的信息偏倚。在实验设计之初即应该考虑如何去解决这个问题，并在最后的研究报告中说明是如何去避免这种偏倚的。
- 记忆辅助物，如照片、日记、日历及日程表等都可以帮助研究对象回忆其暴露情况。
- 例如在口服避孕药的病例对照研究中，研究者用上了一个相册，里面有过去几十年市场上的每一种口服避孕药的彩色照片，还提供了一个空白的日历册来帮助研究对象回忆一些主要事件和避孕药的使用情况。这些彩照同时促使病例和对照回忆既往的暴露史，这样可以减少回忆偏倚(recall bias)。如果报道病例对照研究时没有很好地提及这些记忆辅助物，读者则会对其研究不太确信。

六、混杂因素的控制

病例对照研究也要考虑混杂因素。这种偏倚可以在实验设计之时采取限制或者配对的方法来处理，但通常情况下研究者倾向于在数据处理阶段采用类似Logistic回归或者Mantel-Haenszel分层等分析方法来解决。
如果是后者（即在数据处理阶段控制混杂因素），研究者应该事先做好计划，搜集那些潜在混杂因素变量的数据。不论使用什么分析方法研究者都不能校正无数据的变量。
如果潜在混杂因素出现测量误差，不管怎么校正都会导致残存混杂。

七、结论

设计良好、执行谨慎的病例对照研究能产生有用而可信的结果。
不过，研究者必须始终特别去注意对照组的选择和暴露信息的获取这两方面。
同样，读者记住这两个要点有助于他们从这类研究报道中去评价研究的长处和短处。
研究者应准确而全面地记录其研究方法增强其研究的可信度。

高山流水

临床研究基本概念：观察性研究（四）