0%

首诊时就出现转移灶的骨肉瘤患者危险因素分析

说明:
1. 翻译自Miller BJ, Cram P, Lynch CF, et al.Risk factors for metastatic disease at presentation with osteosarcoma: an analysis of the SEER database.J Bone Joint Surg Am, 2013,95(13):e89.

一、前言

  1. 据估计,15%-20%的骨肉瘤患者在首次就诊时就有明显的转移灶,与未发生转移的局部骨肉瘤患者相比,这些患者的预后要差得多。
  2. 对首次就诊时就出现明显转移灶的风险的相关临床特征的数据非常少。由于骨肉瘤是一种罕见的肿瘤,根据年龄的不同,每年每百万人口发病率为1.7-4.4,因此很难获得有意义数量的患者进行研究。
  3. 本研究的目的是分析下列因素,以确定与首诊时出现转移灶发生率增加相关的因素。从而能够深入了解在诊断之前与转移性骨肉瘤进展相关的患者,肿瘤和社会经济因素:
    • 患者特征
      • 年龄
      • 性别
      • 种族
    • 肿瘤特征
      • 部位
      • 组织学亚型
      • 大小
    • county level的社会经济状况
      • 中位家庭收入
      • 生活在贫困线以下的人口比例
      • 25岁以上高中以下学历的人口比例
      • rural or urban county setting

二、材料与方法

  1. 选取2000年至2008年期间,SEER数据库中列出的所有骨肉瘤患者。该时间段反映了来自所有17个SEER登记处的数据收集,并保证了选取感兴趣的群体和用于诊断转移性灶方法的一致性。
  2. SEER数据库是公开可用的,不包含唯一的患者标识符(unique patient identifiers)。
  3. 使用SEER*Stat程序(版本7.0.9)确定频率和感兴趣的变量。

(一)数据元素

####患者变量 包括年龄,性别和种族。

  1. 年龄在SEER数据库中记录为以五年为间隔的从0到85岁(或更长)的分类变量。
  2. 骨肉瘤相对于年龄的发病率呈双峰分布,不同病理亚型好发于年轻患者和老年患者。
  3. 我们将患者分为三个年龄组:
    • 0-24岁
    • 25-59岁
    • >60岁
  4. 患者的种族被分为:
    • 白人(white)
    • 黑人(black)
    • 其他种族(other)

肿瘤特异性变量

包括组织学亚型,肿瘤位置和大小

  1. 组织学亚型根据国际肿瘤疾病分类标准,第3版(IDO-O-3)进行分类。
  2. 肿瘤大小记录为连续变量,精确到毫米。
  3. 与其他年龄组的患者相比,老年患者中的骨肉瘤具有较高的放疗后骨肉瘤和Paget disease恶变的比例。尽管,我们能够确定与Paget disease恶变相关的骨肉瘤病例,但放疗后骨肉瘤未被列为特定的亚型。
  4. SEER数据库不包括恶性肿瘤的顺序(例如,第一原发,两个或更多原发肿瘤中的第二个等)。
    • 为了确定放疗后骨肉瘤,我们区分了第一原发恶性肿瘤患者(first primary malignancy)和既往有恶性肿瘤病史的患者(prior malignancy)。
  5. SEER数据库中的解剖部位信息是相对非特异性(non-specific)的,并不表示所涉及的特定骨骼或该骨骼内的位置。解剖部位被分为:
    • 中轴骨:
      • 骨盆
      • 脊柱
      • 肋骨
    • 四肢:
      • 上下肢的长短骨
    • 其他:
      • 下颌骨
      • 颅骨
      • 其它非典型位置

基于患者居住地的社会经济测量数据

  1. 感兴趣的County-level的社会经济变量包括:

    • (1)中位家庭收入
    • (2)生活在贫困线以下的人口比例
    • (3)25岁以上高中以下学历的人口比例
    • (4)rural or urban county setting。(根据2000年美国人口普查)
  2. 我们使用这些社会经济状况(socioeconomic status,SES)变量中的一部分来计算综合得分以进行比较。

    • 简而言之,County-level的中位家庭收入,生活在贫困线以下的人口比例,25岁以上高中以下学历的人口比例均被划分为四个级别。将四个级别分别赋值为1分-4分,分值越高,表明收入越高,越富裕,受教育程度越高。
    • 这三个社会经济变量中的每一个都具有相同的权重并加在一起以创建复合SES分数。
      • 中位家庭收入
          1. <46,450美元
          1. 46,450-51,400美元
          1. 51,410-63,550美元
          1. 63,550美元

      • 生活在贫困线以下的人口比例
          1. 17.90%

          1. 12.44% to 17.90%
          1. 8.41% to 12.43%
          1. <8.41%
      • 25岁以上高中以下学历的人口比例
          1. 28.77%

          1. 18.82% to 28.77%
          1. 15.16% to 18.81%
          1. <15.16%
    • 然后将具有最低可能的SES变量组合(每个变量内的最低四分位数)的患者与其余患者进行比较。
  3. 根据美国农业部制定的农村-城市连续性编码(Rural-Urban Continuum Codes),人口密度可分为大都市区的郡(城市)和非大都市区(农村)的郡。

    National Cancer Institute. Surveillance epidemiology and end results: county attributes. 2012 Apr 16. http://seer.cancer.gov/seerstat/variables/countyattribs/. Accessed 2012 Aug 5.

主要结局

  1. 在首诊时是否出现转移灶。
    • 编码为localized/regional:无转移灶(n = 1633)
    • 编码为distant:患者在首诊时即出现转移灶(n = 468)
    • 缺少localized/regional/distant编码(blank)或编码为unstaged的患者则被排除在外 (n = 146) 。

(二)统计学分析

  1. 首先计算了所有骨肉瘤患者中各种组织学亚型的频数。

  2. 然后依据年龄,种族,性别,肿瘤位置和大小以及社会经济状况等关键因素,使用描述性统计学和单因素方法(chi-square tests)来检验localized/distant metastatic之间的比例。

  3. 最后建立一系列回归模型(regression models)检验首诊时就出现转移灶、队列人群与性别、年龄、种族、组织学亚型,肿瘤位置、肿瘤大小、复合SES评分、rural or urban setting和肿瘤病史之间的关系。

    Finally, a series of regression models were used to examine the association between presentation with distant metastatic disease and an array of patient and county-level measures including sex, age, race, histologic subtype, tumor location, tumor size, composite SES score, rural or urban setting, and history of cancer.

(三)模型筛选

  1. 最开始的logistic回归分析包括各个预测因子的简单单因素模型。
  2. 仅将那些具有实质关联的预测变量(p <0.1),纳入多因素模型,并通过逐步回归进行筛选。
  3. 第一个多因素模型使用2017例高级别骨肉瘤患者作为整体样本,排除肿瘤大小作为预测因子(predictor)。该模型纳入的显著变量包括年龄、肿瘤位置和复合SES评分。
  4. 第二个单独的多因素模型使用了更有限的1398例患者作为样本(不包括619个肿瘤大小缺失的样本)
    • 纳入年龄,肿瘤位置和肿瘤大小作为显著预测因素。
    • 此外,鉴于SES在整个队列的多因素分析中具有显著的关联度,因此SES作为可能的风险因素保留在该模型中。
  5. 第三个模型纳入了所有分析的变量,以验证我们研究结果的稳定性。

(四)缺失数据

在单因素分析和回归建模中使用的两个预测变量都有缺失数据。

  1. 具体而言,2017例高级别骨肉瘤患者中有1例缺失geographic setting (rural or urban),并且619例缺失肿瘤大小的数值。

  2. 2017例患者的整个队列在进行任何分析时,都不纳入这些变量。

    The entire identified cohort of 2017 patients was utilized for any portion of the analysis that did not include use of these variables.

  3. 当这些变量是单因素分析或回归模型的一部分时,具有缺失数据的条目被排除在该特定分析之外。

  4. 我们还进行了敏感性分析(sensitivity analysis),以检验我们处理缺失数据对结局的影响。

  5. 创建汇总变量以验证是否记录了患者的肿瘤大小。

    A summary variable was created to indicate whether or not a patient’s tumor size was recorded.

  6. 这个“missing size”变量用于整个队列的回归分析,以确定该变量的纳入,对OR(odds ratio)的估计是否有任何影响。

三、结果

(一)组织学亚型

  1. SEER数据库包含2000年至2008年诊断出的2101例骨肉瘤病例。包括所有组织学亚型在内,远处转移的总体发生率为22.3%。

  2. 与许多其他骨肉瘤亚型相比,骨内分化良好的骨肉瘤(intraosseous well-differentiated osteosarcoma)和骨旁骨肉瘤(parosteal osteosarcoma)患者不太可能出现远处转移(Table I)。

  3. 此外,与其他高级别骨肉瘤亚型相比,这两种亚型的临床侵袭性较小,因而在被区别对待。基于这些原因,我们排除骨内分化良好的骨肉瘤和骨旁骨肉瘤(n = 84),只留下2017例高级别骨肉瘤作为最终队列。

(二)年龄

  1. 2017例患者大部分为青少年,这与之前的数据一致(Fig. 1)。

  2. 不同年龄阶段患者,首诊时出现转移灶的比例也不同 (Fig. 2)。

  3. 具体而言,年龄为60岁或以上的患者(37.1%)比年龄小于60岁的患者更容易在首诊时发现转移灶(20.2%,p <0.001)。

(三)单因素分析

  1. 当患者根据年龄,肿瘤位置,肿瘤大小,家庭收入中位数和复合SES评分进行分层时,首诊时发现转移灶的发生率也存在显着差异(Table II)。

    • 60岁或以上(p <0.001)
    • 中轴骨(p <0.001)
    • 肿瘤更大(p <0.001)
    • 收入的最低四分位数(p = 0.011)
    • 复合SES评分的Lowest twelfth(p = 0.019)

  2. 由于老年患者在首诊时出现转移灶的比例较高,我们进行了额外的分析,更详细地研究年龄为60岁或以上的患者(Table III)。

    • 该老年人群中肿瘤位于中轴骨患者的转移率>50%。
    • 既往有肿瘤病史的患者或Paget病患者未发现肿瘤转移的风险增加。
    • 老年Paget病患者(31.8%)的转移率略高于不同组织学亚型(37.5%)的老年患者,但差异无统计学意义(p = 0.596)。
    • 然而,由于Paget病患者中骨肉瘤病例数量有限(整个队列中为25例,年龄为60岁或以上的患者中为22例),该研究没有足够的效力(power)来检测真实区别。

  3. 单变量logistic回归模型(Table IV-Model 1 Unadjusted)发现,下列患者在首诊时出现转移灶的风险较大:

    • 年龄为60岁或以上的患者 (OR = 2.22; 95% confidence interval [CI], 1.71 to 2.89)
    • 肿瘤位于中轴骨的患者 (OR = 2.47; 95% CI, 1.88 to 3.26)
    • 肿瘤体积较大的患者 (OR = 1.10; 95% CI, 1.08 to 1.13; for each 1-cm increase in size)
    • 复合SES评分最低的患者 (OR = 1.59; 95% CI, 1.08 to 2.35)

(四)多因素分析

  1. 当向模型中添加更多变量时,年龄,肿瘤位置和肿瘤大小的估计OR值(estimated ORs)保持稳定。

  2. 当肿瘤大小(tumor size)纳入多因素模型中时,复合SES评分作为危险因素失去显著性。

    • 由于存在缺失数据,样本量在纳入肿瘤大小的模型中减少了619例(包括619例患者相应的条目)。
  3. SES作为预测变量的显著性丧失的可能解释是:

    • 与纳入者相比(22/88,25%),未纳入的患者中,具有最低SES分数的组中呈现的转移率更高(18/39,46%)(p = 0.018)。
    • 此外,未记录肿瘤大小的个体更容易出现转移灶(29.1%与20.3%,p <0.001)。
  4. 整个队列(2017例,包括表示患者是否具有肿瘤大小记录值的汇总变量)的敏感性分析,得出的估计值与初步分析的估计值相似。

    The sensitivity analysis that involved the entire cohort of 2017 cases and included the summary variable representing whether or not a patient had a recorded value for tumor size yielded estimates that were similar to those of the primary analysis.

  5. 控制缺失值信息、年龄,肿瘤位置和复合SES评分的多因素分析显示:缺失的肿瘤体积的信息可预测首诊时的转移(OR = 1.46; 95%CI,1.16-1.82)。

  6. 但是,下列三个因素的OR估计值与去除肿瘤大小信息缺失的病例后的分析相似。

    • 年龄为60岁或以上 (OR = 2.04; 95% CI, 1.53 to 2.73)
    • 肿瘤位于中轴骨 (OR = 2.10; 95% CI, 1.56 to 2.84)
    • 较低的复合SES得分 (OR = 1.62; 95% CI, 1.08 to 2.42)

四、讨论

(一)文献回顾与本研究特点

  1. 对2000年至2008年SEER数据库的分析显示,23.0%的高级别骨肉瘤病例在初诊时就出现远处转移灶。
  2. 本研究表明,老年患者,肿瘤位于中轴骨,肿瘤大小更大以及居住在最不富裕的区域都与首诊时就发现转移灶的更大的可能性相关。
  3. Bacci et al.报道,局灶骨肉瘤患者的两年总体生存率为94%,而伴有转移灶的骨肉瘤患者的两年总体生存率为55%。
  4. Bielack et al.发现局灶骨肉瘤和伴有转移灶的骨肉瘤患者的五年总体生存率分别为70.1%和31.6%,十年总体生存率分别为64.4%和26.7%。
  5. Bielack et al.还发现更大的肿瘤体积、肿瘤位于中轴骨和较长的症状史与初诊时就出现远处转移灶相关。据我们所知,这是以前对初诊时就出现远处转移灶患者的临床危险因素进行讨论的唯一报道。
  6. 本研究特色:
    • 首先,本研究使用了一个更大的队列,是美国人口的代表性横截面。
    • 其次,我们能够将肿瘤大小视为一个连续变量,并确定肿瘤大小每增加1厘米,首诊时出现转移灶的几率可能会增加10%。
    • 最后,除肿瘤和患者特征外,我们还能够纳入社会经济指标。

(二)年龄

  1. 60岁或以上的年龄是首诊时出现转移灶的独立危险因素。许多先前的研究表明,骨肉瘤患者的年龄增加与预后较差有关。

  2. 然而,关于年龄本身是一个风险因素还是仅仅是该疾病其他更重要因素的表象,存在着相当大的不确定性和争论。

    However, there is substantial uncertainty and debate regarding whether age itself is a risk factor or is simply a surrogate for other, more important, aspects of the disease.

    • 例如,老年患者中,肿瘤位于中轴骨和肿瘤体积较大的比例更高,这两者都与较差的预后相关。
    • 老年肿瘤患者中更多的血管生成(Greater angiogenesis)也可能导致早期转移的发生率更高。
    • 老年患者还受到不同的骨肉瘤亚型的影响,特别是与Paget病和放射后骨肉瘤相关的骨肉瘤,其生物学行为可能与普通骨肉瘤不同。
    • 老年人也可能有更多的医学合并症,使化疗选择复杂化并降低对化疗的治疗反应。
  3. 在本研究中,即使控制肿瘤位置,大小和组织学亚型后,60岁或更长的年龄是首诊时出现远处转移灶的独立危险因素。

(三)肿瘤部位与诊断延迟

  1. 肿瘤位于中轴骨和肿瘤体积较大是首诊时出现远处转移灶的独立危险因素。在这些病例中较差的肿瘤学结果可部分解释为难以进行手术切除并获得足够的切缘。
  2. 肿瘤位于中轴骨通常更接近大静脉窦,这可能增加转移的可能性。
  3. 中轴骨上的肿瘤往往在其他位置的肿瘤已被注意和评估的时间内未被检测到。
  4. 这表明,症状持续时间较长可能导致中轴骨肿瘤和体积较大肿瘤的转移率增加,因为随着时间的推移,肿瘤细胞继续未经治疗地分裂,远处转移的可能性增加。
  5. 然而,我们知道迄今为止没有确凿证据证明诊断延迟与生存率下降有关。
  6. 通过使用各种筛选策略,可以在症状出现之前鉴定比较常见的恶性肿瘤,例如乳腺癌,前列腺癌和结肠癌。
  7. 然而,骨肉瘤非常罕见,任何利用现有技术的筛查研究都不会有效或合理。

(四)复合SES评分

  1. 我们发现居住在复合SES评分最低区域的患者出现转移的风险较高,这是一项新的观察。社会经济状况是一个结合了许多个人细节,社会因素和当地基础设施的概念。

    Socioeconomic status is a concept that combines many individual details, social factors, and local infrastructure.

  2. 较低的SES分数可能反映出该区域医疗保健机会较少。它还可能反映出居民总体上不愿意或无法及时寻求治疗,导致诊断延误。

  3. 本研究中的综合SES评分未考虑可能影响个人社会经济状况的许多因素。然而,使用现有数据来调查社区层面的差异是否会影响个体的疾病表现仍然是值得的。

  4. 虽然SEER数据库中可用的患者层面的信息有限,但可以根据county level数据合理地做出一些推论。

    • 例如,SES评分较低的county可以代表资源较少且获得医疗服务机会较少的地区。
  5. 我们发现生活在最贫困和受教育程度最低的county的患者在诊断之前出现转移灶的可能性增加。这可能表明存在集体理解和基础设施的关键水平,低于该水平,则首诊时出现转移灶的风险增加。

    This may suggest that there is a critical level of collective understanding and infrastructure below which the risk of metastasis at presentation increases.

(五)研究意义

  1. 虽然本研究并非旨在指导诊断后的治疗,但我们的研究结果确实对临床实践有一些潜在的影响。
  2. 高风险群体的识别可以帮助医生在诊断骨肉瘤时告知患者发现转移灶的可能性,因为高风险组首诊时的转移率远远高于20%的总体人群。
  3. 不确定这些高风险患者是否会受益于更严密的肺部监测或对不确定的肺结节的积极治疗。
  4. 但是首诊时出现转移灶的高比例表明,这些高风险群体将是进一步研究上述问题的理想样本。

五、局限性

  1. 首先,使用大型国家级数据库,同时提供大量案例进行分析,并非没有相应的限制。我们无法确认组织学诊断的准确性或肿瘤转移灶的鉴定。

    We were not able to confirm the accuracy of the histologic diagnoses or identification of metastatic disease.

  2. 此外,我们没有关于所报道肿瘤的大小或具体位置的完整信息。

  3. 其次,我们依靠county-level数据得出有关个人社会经济地位的结论。虽然这种策略是合理的,但它没有考虑到感兴趣领域内收入,贫富程度或教育的变化。

  4. 最后,我们没有调查样本组中使用的治疗方法或肿瘤学结果。这不是本研究的目的,但它代表了进一步研究的重要领域。

六、结论

  1. 更容易在首诊时出现转移灶的骨肉瘤患者特点:
    • 年龄较大(60岁及以上)
    • 肿瘤位于中轴骨
    • 肿瘤体积较大
    • 居住在不富裕的county