0%

SEER数据库中高级别骨肉瘤患者的预后因素

说明:
1. 翻译自Duchman KR, Gao Y, Miller BJ.Prognostic factors for survival in patients with high-grade osteosarcoma using the Surveillance, Epidemiology, and End Results (SEER) Program database.Cancer Epidemiol,2015,39(4):593-9.

一、前言

  1. 自20世纪70年代引入化疗方案以来,新辅助化疗后行手术切除一直是高级别骨肉瘤的治疗标准。

  2. 随着化疗方案的加强,高级别骨肉瘤患者的生存率有所提高,非转移性骨肉瘤患者的5年生存率超过60%。然而,如果首诊时就表现为全身转移,则一直意味着较差的预后。

  3. 据报道,生活在较不富裕社区的患者在诊断骨肉瘤时更可能出现转移,但社会经济状况对生存的影响尚未确定。

  4. 已经发现基于社会经济状况和其他社会变量的医疗保健差异(Healthcare disparities)会影响:

    • 症状持续的时间(time to presentation)
    • 就诊时的疾病分期(stage at presentation)
    • 治疗决策
    • 癌症患者的生存期
  5. 虽然患者和肿瘤特异性特征通常是不会变化的,但患者的社会经济状况和随后获得的医疗保健是可以更改的:

    While patient and tumor-specific characteristics are frequently non-modifiable, a patient’s socioeconomic status and subsequent access to health- care can potentially be addressed.

  6. SEER数据库建于1973年,收集来自美国各地17个癌症登记注册中心的数据。

  7. 本研究的目的是:

    • 确定诊断后高级别骨肉瘤患者的10年原因特异性生存率(cause-specific survival)。
    • 确定导致高级别骨肉瘤患者的原因特异性生存率降低相关的患者,肿瘤和社会经济变量。

二、材料与方法

(一)纳入标准

  1. 选取1991年至2010年期间,SEER数据库中列出的所有高级别骨肉瘤患者。
  2. 选择该时间框架的原因:现代的化疗方案和MRI在此期间一直可以获得和应用。
  3. 被认为是高级别骨肉瘤的组织学亚型包括:
    • 骨肉瘤(osteosarcoma)
    • NOS
    • 成软骨型骨肉瘤(chondroblastic osteosarcoma)
    • 成纤维型骨肉瘤(fibroblastic osteosarcoma)
    • 毛细血管扩张型骨肉瘤(telangiectatic osteosarcoma)
    • 佩吉特病继发骨肉瘤(osteosarcoma in Paget disease)
    • 小细胞骨肉瘤(small cell osteosarcoma)
    • 中心型骨肉瘤(central osteosarcoma)
    • 高级别表面骨肉瘤(high-grade surface osteosarcoma)
    • 恶性骨肉瘤(malignant osteosarcoma)
  4. SEER数据库是公开可用的,并且使用SEER*Stat程序(版本8.1.5)识别感兴趣的病例和相关变量。

(二)数据元素

包括年龄,性别和种族。

患者变量

  1. 年龄在SEER数据库中记录为以五年为间隔的从0到85岁的分类变量。
  2. 我们选择将患者分为三个年龄组:
    • 0-24岁
    • 25-59岁
    • >60岁
  3. 患者的种族被分为:
    • 白人(white)
    • 黑人(black)
    • 其他种族(other)

肿瘤特异性变量

纳入用于分析的包括组织学亚型,初诊时是否转移,肿瘤位置和大小。高级别骨肉瘤组织学亚型根据国际肿瘤疾病分类标准,第3版(IDO-O-3)进行分类。

International Classification of Disease for Oncology, 3rd Edition (IDO-O-3)

  1. 初诊时是否转移:
    • 编码为localized/regional:无转移灶(n = 2188)
    • 编码为distant:患者在首诊时即出现转移灶(n = 661)
    • 缺少localized/regional/distant编码的患者则被排除在外
  2. 肿瘤的解剖部位被分为:
    • 中轴骨:包括骨盆、脊柱和肋骨
    • 四肢:包括上下肢的长短骨
  3. 肿瘤大小分为:
    • 小(5 cm)
    • 中(> 5-10 cm)
    • 大(> 10 cm)
    • 未知

基于患者居住地的社会经济测量数据

感兴趣的County-level的社会经济变量包括:(1)中位家庭收入,(2)生活在贫困线以下的人口比例,(3)25岁以上高中以下学历的人口比例,(4)rural or urban county setting。

  1. 如前所述,使用该数据创建了复合社会经济状况(composite socioeconomic status,SES)变量。复合SES评分进一步分为:
    • 低(composite SES ≤4)
    • 中(composite SES 5-10)
    • 高(composite SES ≥11)
  2. 简而言之,County-level的中位家庭收入,生活在贫困线以下的人口比例,25岁以上高中以下学历的人口比例均被划分为四个级别,分值越高,表明收入越高,越富裕,受教育程度越高。这三个社会经济变量中的每一个都具有相同的权重并加在一起以创建复合SES分数。
  3. 复合SES评分(分值范围为3-12分)进一步分为:
    • 低(composite SES≤4)
    • 中(composite SES 5-10)
    • 高(composite SES≥11)

主要结局

  1. 原因特异性生存率是感兴趣的主要结局,并使用死亡证书(death certificates)中的摘要信息来确定死因,这些数据被二分为:
    • 癌症(cancer)
    • 其他原因(other causes)
  2. 任何可归因于复发或转移的死亡都被认为是由于“癌症(cancer)”造成的死亡。

(三)统计学分析

  1. 估计的原因特异性生存率(Estimated cause-specific survival)计算为从诊断到死亡(可归因于肿瘤)的时间。

    • 由于所有的患者都是单一的原发性肿瘤,所以因肿瘤导致的死亡都可以认为是由高级别骨肉瘤引起的死亡。
  2. 使用Kaplan-Meier方法,计算估计的2年,5年和10年的原因特异性生存率。所研究人群的最终随访时间是2010年12月31日。

  3. 对因癌症而死亡(Patients with death attributable to cancer)或对在感兴趣的时间节点随访不完全的患者进行了审查。

  4. 进行敏感性分析(sensitivity analysis),将整个队列的10年生存率的估计值与完全观察到的患者的10年生存率进行比较(即1991年至2001年间确诊的队列中的患者)。

    • 敏感性分析显示在生存率上没有统计学差异,因此,整个过程中都报道了10年生存率的估计值。
  5. 使用对数秩检验(log-rank test)评估与生存相关的感兴趣的变量。使用Cox比例风险比进行多因素分析,以确定生存率的独立预测因素。

  6. 对多因量分析中纳入的所有变量进行proportional assumption test,发现转移(metastatic disease)是不成比例的(non-proportional)。

  7. 转移(metastatic disease),作为时间依赖性协变量(time-dependent covariate)不纳入多因素模型中,而是在本研究的时间范围内该效应被认为是平均值。

    The time-dependent covariate for metastatic disease was not included within the multivariate models, but rather, the effect was considered an average over the timeframe of the study.

(四)多因素模型筛选

  1. 模型1被完全调整(fully adjusted)并纳入所有感兴趣的变量。
  2. 模型2利用逐步选择纳入所有在单因素分析中p值<0.1的变量,同时保留composite SES score作为临床显著变量(基于既往所报道的尤文肉瘤和骨肉瘤的文献)。
  3. 初步分析显示,与复合SES评分最高(≥11)的患者相比,复合SES评分最低(≤3)的患者在诊断时更可能出现病灶的转移(29.1 vs. 21.7%, p = 0.047),与以前文献报道得一致。
    • 鉴于此发现,肿瘤分期(tumor stage)和SES评分之间的相互作用项(interaction term)包括在模型1和2中,并且发现对生存的预测因素没有显著的影响。
  4. 模型3纳入所有在单因素分析中p<0.1的分类变量,同时排除首诊时出现转移,以进一步分离复合SES评分对生存的影响。

(五)缺失数据

  1. 肿瘤大小是SEER数据库中报道最不一致的变量,队列中921/2849(32.3%)的患者该数据缺失。
  2. 没有肿瘤大小数据的患者在统计分析中被归类到协变量肿瘤大小中的未知(Unknown)。

三、结果

(一)原因特异性生存率(Cause-specific survival)

  1. 从1991年到2010年的SEER数据库中,纳入2849例高级别骨肉瘤患者。其中,661/2849 (23.2%) 的患者在首诊时出现转移灶(Table 1)。

  2. 首诊时无转移灶的患者,其2年,5年和10年的原因特异性生存率分别为83.6%,71.8%和65.8%。

  3. 首诊时有转移灶的患者,其2年,5年和10年的原因特异性生存率分别为48.4%,30.4%和24.0%。

(二)单因素分析

  1. 与复合SES评分最高组(≥11)的患者相比,复合SES评分最低组(≤3)的患者更常出现肿瘤转移(29.1 vs. 21.7,p = 0.047),肿瘤直径也更容易≥10cm(48.7% vs. 38.3%, p = 0.045)。
  2. 与其他所有种族相比,黑人患者更可能具有最低的复合SES评分(≤3)(28.0 vs. 18.2, p = 0.025) ,肿瘤直径也更容易≥10cm (49.1% vs. 42.7%, p = 0.046) 。
  3. 与原因特异性生存率降低有关 (Fig. 1):
    • 在首诊时出现转移灶(p < 0.001)

    • 年龄≥60岁(p < 0.001)

    • 肿瘤位于中轴骨(p < 0.001)

    • 肿瘤大小>10cm(p < 0.001)

    • 男性(p = 0.004)

    • 复合SES评分最低的患者组(p = 0.030)

    • Paget’s histology (p < 0.001)

(三)多因素分析

  1. 开发了几个多因素模型以确定独立的预后因素。10年原因特异性生存率降低的独立预后因素(Table 2):
    • 在首诊时出现转移灶

    • 年龄在25-29岁

    • 年龄≥60岁

    • 男性

    • 肿瘤位于中轴骨

    • 肿瘤大小>10cm

    • 肿瘤大小未知

  2. 成纤维型骨肉瘤在多因素分析中赋予改善的生存率。
  3. 模型3纳入所有在单因素分析中p<0.1的分类变量,同时排除首诊时出现转移,以进一步分离复合SES评分对生存的影响。
    • 因为具有最低复合SES评分(≤3)的患者组中肿瘤转移的频率增加。
    • 排除首诊时出现转移后,最低复合SES评分成为10年原因特异性生存率的独立危险因素。
    • 为了进一步探索这一发现的敏感性,将分析中的首诊时出现转移重新添加到分析中,并且将剩余的变量依次剔除并重新添加(年龄,性别,位置,大小和病理类型),以确定复合SES评分与其他分类变量之间的任何关联。
    • 除了首诊时出现转移外,复合SES评分在消除任何其他分类变量后不会成为生存率的独立危险因素。

四、讨论

一些研究已经确定了预测骨肉瘤患者生存率降低的临床变量。

(一)转移

  1. Bielack et al发现,确诊时就有转移灶是生存率降低的独立危险因素,10年总生存率为26.7%。
  2. 我们的研究结果与之前的报告一致,首诊时出现转移预示着高级别骨肉瘤患者的最差生存率。

(二)年龄

  1. 患者年龄的增加也与预后不良有关。虽然已显示骨肉瘤具有双峰年龄分布,但肿瘤和宿主生物学表现在两个群体之间存在差异。
  2. 有学者提出,与年轻患者相比,年龄较大的患者更容易出现转移灶并且接受化疗的次数较少或剂量较低。
  3. 在本研究中,控制组织学亚型后,25-59岁和≥60岁的患者被确定为降低原因特异性生存率的独立危险因素。
  4. 最值得注意的是,≥60岁患者的原因特异性死亡风险增加近三倍,接近于首诊时出现转移的患者的风险比(hazards ratio)。

(三)肿瘤位置和大小

  1. 本研究还确定了肿瘤位于中轴骨,肿瘤大小≥10cm和肿瘤大小未知是原因特异性生存率降低的独立危险因素。
  2. 肿瘤体积较大一直预示着预后不良,而肿瘤位于中轴骨已经显示出以类似的方式影响患者的生存。
  3. 肿瘤位于中轴骨和肿瘤体积较大的患者,更容易出现转移灶,且手术切除时不容易获得足够的切缘,这些能够部分解释其生存率降低的原因。
  4. 在我们的分析中,即使控制首诊时出现转移,肿瘤大小和位置仍然很重要,这意味着肿瘤位于中轴骨和肿瘤体积较大可能在治疗期间或之后更加容易发生转移。
  5. 虽然SEER数据库中没有标注肿瘤大小数据缺失的原因,但以前的文献表明SEER数据库中肿瘤大小数据缺失时,通常为更晚期的肿瘤。

(四)性别

  1. 男性也被确定为原因特异性生存率降低的独立危险因素。

    • Bielack et al报道,男性对新辅助化疗的反应较差,Saeter et al的研究表明,男性的肿瘤复发率高于女性。
  2. 男性可能在生物学上处于更容易患侵袭性肿瘤或对治疗反应较差的风险中。

    It is possible that males are biologically at risk of more aggressive tumors or poorer response to treatment.

  3. 另一个值得关注的问题是,男性,特别是年轻男性,可能具有社会趋势(social tendencies),通常会让症状拖延很久才去就诊,并且可能不遵守通常推荐的治疗。

  4. 虽然我们对这一发现没有令人满意的解释,但这种趋势在所有时间点和模型上都是一致的,并且是进一步研究的重要领域。

(五)社会经济状况

  1. 我们发现,与居住在较高社会经济状况县的患者相比,居住在最贫困,受教育程度最低和收入最低的县的患者生存率较低。
  2. 尽管有国家层面的共同筹划,但癌症患者的生存仍然受到其社会经济地位的影响。
  3. Nathan和Healey利用state-level人均收入数据对骨肉瘤患者进行了研究,他们指出,与最不富裕的州相比,生活在最富裕州的患者的生存率有所提高。我们的研究以几种有意义的方式支持和扩展了以前的这些报告。
  4. 与更富裕的患者相比,具有最低复合SES评分的患者更可能出现转移灶,以及更大体积的肿瘤。
  5. 由于这种关联以及首诊时出现转移和肿瘤大小对原因特异性生存率的显著影响,复合SES评分对生存的影响隐藏在多因素模型中。
  6. 由于生存率下降似乎是由于伴有转移灶和肿瘤体积较大的患者数量较多,公共卫生工作应侧重于提高患者的意识和获得医疗保健的途径,以试图在病灶转移前早期确诊骨肉瘤。

五、局限性

  1. SEER数据库提供的社会经济数据的地理划分是县级水平,可能不像人口普查区(census tracts)或邮政编码区(zip codes)那样敏感,特别是在差异较大的县之间。
  2. 然而,在发病​​率低的肿瘤中,例如骨肉瘤,SEER数据库仍然是无与伦比的资源。在计算特定原因的生存率时,确定死​​因本身就很重要。
  3. 使用死亡证书(death certificates)计算原因特异性生存率以确定死亡原因,如果列出多种死因,则可能是不准确或难以解释的。但这种生存分析的方法先前已在文献中使用过。
    • 我们试图通过将我们的分析局限于单个原发肿瘤患者来消除对肿瘤引起的死亡的任何混淆。尽管我们做了大量的努力,但我们承认肿瘤死亡可能是由于在初始诊断为高级别骨肉瘤时未出现的第二个原发性肿瘤(例如,当SEER数据库编码不正确时)。
    • 但是,我们没有理由相信这种情况很常见。在我们的分析中,肿瘤大小是报告最不一致的变量,未缺失数据仅为已建立队列的67.7%。
  4. 虽然肿瘤大小未知的这些患者作为单独的协变量被纳入在分析中,但是肿瘤大小未知的原因尚不清楚,并且该子集患者具有显著统计学意义的原因纯粹是推测性的。
  5. 虽然SEER数据库提供了几个治疗变量,但未收集化疗数据。因此,本研究中未纳入治疗变量,因为在本研究的时间范围内,肿瘤切除和化疗是高级别骨肉瘤的主要治疗方法。
  6. SEER数据库不收集局部复发或转移扩散的信息,因此除了原因特异性生存率之外,这种限制使我们无法报告无病生存率(cause-specific survival)。虽然这不是我们此次研究的目标,但它是进一步研究的重要主题。