说明
1. 译自Keith Goldfeld的文章Visualizing how confounding biases estimates of population-wide (or marginal) average causal effects
当我们试图评估暴露或干预对结果的影响时,混淆因素(confounding)对我们得出正确结论的能力始终存在威胁。我的目标是考虑一下如何描述混淆的方式,使得有可能从表面上看出为什么不正确地估计干预效应(intervention effects)可能会导致偏倚。
混淆、潜在的结果和因果效应
通常,我们认为混淆因素会影响暴露和结果。如果,我们在评价暴露效果的时候,忽略混杂因素,我们可能轻易地高估或低估由于暴露所造成的效果大小。
如果病情较重的患者比健康的患者更有可能服用某种特定的药物,那么服用该药的患者,其相对较差的预后,可能是由于最初的健康状况而不是药物造成的。
一个稍微不同的混淆因素的观点与潜在结果的概念性框架相关联。如果一个个体受到特定的暴露,我们可能会观察到一个潜在的结果。我们可能会或可能不会观察到潜在的结果:这取决于实际的暴露程度。(为了简化,假定我们只对两种不同的暴露感兴趣。)
\(Y_0\)代表患者未受到暴露,\(Y_1\)代表患者受到暴露。暴露因素对个人i的因果影响(causal effect)可以被定义为\(Y_{1i}-Y_{0i}\)。
如果我们有足够长的时间来观察两种状态(有或没有暴露)下,每一个研究对象的结局\(Y\),并测量两种潜在的结局以及因果效应。对样本中所有个体进行平均,可以估计人口平均因果效应。(Think of a crossover or N-of-1 study.)
不幸的是,在现实世界中,将个体暴露于多种条件下几乎是不可行的。只能设置对照组和暴露组,进行比较(除了暴露因素以外,两组其他情况都相同)。
我们的目标是比较对照组与暴露组的结果分布。我们经常通过查看每个分布的均值来简化这种比较。
平均因果效应(所有个体)可以写成\(E(Y_{1i}-Y_{0i})\)。\(E()\)是期望值或平均值。实际上,我们无法直接衡量这一点,因为每个人只能观察到一个潜在的结果。
我们可以使用观察到的测量值来估计无法观察的平均因果效应。
- 因为期望是线性的。故此:E(Y1-Y0)=E(Y1)-E(Y0)
- 可以说\[A_1 = 5 \]
\[\frac{a}{b}\]