0%

手腕部骨龄评价方法(未完)

  1. 在骨发育成熟度评价方法(骨龄)的研究过程中,曾经采用拍摄身体一侧各关节的X线片,计数骨化中心数目或以骨化中心出现和骺融合年龄的方法来评价骨龄,但这种方法X线暴露过多,而且忽略了骨化中心由出现到融合之间骨骼形态结构的变化,所以在实践中未能得到应用。
  2. 虽然不同关节部位对不同年龄段的骨龄评价有不同的效果,但由于手腕部骨骼代表了全身骨发育状况,对儿童的X线照射剂量很小,所以依手腕部骨化中心所制订的骨龄标准与评价方法在国内外得到了广泛应用。

一、骨化中心出现与融合年龄

  1. 在20世纪20~60年代,大多使用骨化中心出现年龄与融合年龄表评价骨骼的成熟程度。
    • 这种年龄表由统计足够数量儿童每一骨化中心出现和融合年龄的范围而制订,例如:
      • 男桡骨骨化中心出现年龄为7个月〜8岁
      • 骺干融合年龄为17〜20岁
    • 这种方法虽然简单、方便,但过于粗略,只能对成熟程度做出大致的估价,无法得出具体的骨龄数值,使用范围也仅限于学龄前和青春期后期。所以这类方法已很少应用。
  2. 1973年,Yarbrough等(1973)根据0~7岁的1447名危地马拉儿童和2130名美国儿童,报告了以手腕部骨化中心出现数量(豌豆骨和籽骨除外)评价学龄前儿童骨龄的方法。不同种族儿童样本的手腕骨均有规律的骨化次序,通过评价个体儿童在这种骨化次序中所处的阶段可得出骨龄,其骨龄评价的可靠性甚至好于G-P图谱和TW1计分法。

二、经典方法

(一)G-P(Greulich and Pyle)图谱法

  1. 1935年,Sieget依据444名德国儿童(男200,女244)手腕部X线片的横断研究出版了第一部手腕骨成熟度图谱,但实际上该图谱为0~12岁儿童骨发育成熟度的案例报告。
  2. 1936年,美国的Flory根据5000名芝加哥儿童也出版了一部手腕骨发育图谱,但受试者的资料没有标准化,而且X线片的质量较差。
  3. 1929年,美国俄亥俄州克利夫兰地区西储大学医学院的Todd教授开始精心筹备综合性的儿童生长发育调查,在1931年该计划付诸实施。
    • 研究工作所需经费由布拉什基金提供,因此而称为布拉什基金研究,成为世界上最著名的早期骨发育纵断研究之一。
    • 研究样本均为北欧人后裔,儿童家庭的经济状况及父母受教育程度在平均水平以上。
    • 在儿童出生后第一年每3个月、1~5岁每6个月、其后每年检查一次。
    • 检查时,拍摄身体左侧的肩、肘、手、髋、膝和足部X线片,测量身高、体重。
    • 与此同时,Todd也在较低社会阶层的儿童进行了几项骨发育的横断研究。
    • 1937年,Todd研究分析了上述6个部位的骨成熟度状况,对手腕部给以了最大的关注,依据1000名儿童的X线片,出版了《手部骨成熟度图谱》,因骨发育纵断依据正在进行之中,所以青春期的标准片几乎完全选择于横断研究资料。
    • 1938年,Todd教授去世,斯坦福大学医学院的Greulich教授接替了他的工作。在1942年研究工作结束。
  4. 1950年,Greulich和Pyle根据Todd的设计,完全使用了布拉什纵断研究中的手腕部X线片,出版了《手腕骨发育X线罔谱》,而称为G-P图谱。
    • 在1959年出版的第二版中对标准片做了某些修改,成为国际间著名的G-P骨龄标准图谱(Greulich and Pyle,1959)。
    • G-P图谱共包括男31幅、女29幅标准片,每一幅标准片选自100名同性别、同年龄儿童的X线片。
    • 在每一年龄组中,将每名儿童的X线片按发育程度的高低顺序排列,以中位数作为本年龄组的代表,处于中位数的X线片即为该年龄的标准片。
      • 如,女20号标准片代表了12岁女孩的骨发育程度,所以该标准片的骨龄为12岁。
    • 在不损失准确性的情况下,尽量使用同一名儿童连续几年的X线片作为标准片,以保持骨发育的连续性,减小应用时因骨骼大小差异所造成的困惑。
    • G-P图谱不仅组成了骨龄标准图谱,而且根据纵断研究资料首次系统地提出了手腕部各块骨和骨骺在发育过程中形态特征的X线影像变化,称为成熟度指征(maturity indicator)。
    • 这些成熟度指征不仅为应用G-P图谱时各骨发育状况的比较提供了评价依据,而且也为后来的骨发育研究提供了基础。
  5. 在实践应用中,有三种使用G-P图谱的方式:
    • 整片匹配法:这种使用方法最简便,应用也最普遍。先将要评价的X线片与图谱标准片中同性别的、生活年龄最相近的标准片做整片发育程度的比较;如果不匹配,再与相邻的标准片比较,直到选择出发育程度最为相似的标准片,该标准片的骨龄即为被评价儿童的骨龄。
    • 插入法:如果在上述的比较中,被评价的X线片与标准片均不确切一致,而是处于相邻两幅标准片之间时,那么可取这两幅标准片骨龄读数的平均数作为被评价儿童的骨龄。
    • 逐块骨评价法:在G-P图谱中,对每一幅标准片不仅有成熟度指征发育的文字描述,而且也标注有每块骨的骨龄。可分别采用上述方法评价出每块骨的骨龄,然后取所有骨骨龄的平均数为被评价儿童的骨龄。
      • 这种评价方法是作者Greulich和Pyle所提倡的应用方式,评价结果精确。但这种使用方法要分别评价手腕部28块骨,很费时,所以在临床中很少使用,而是仅在骨发育研究中时有应用。
      • 为了防止使用G-P图谱评价骨龄过程中遗漏重要的成熟度指征,应当养成以固定顺序观察比较的良好习惯。Greulich和Pyle建议的观察顺序为:
        • 桡骨
        • 尺骨
        • 头状骨
        • 钩骨
        • 三角骨
        • 月骨
        • 舟骨
        • 大多角骨
        • 小多角骨
        • 掌骨
        • 近节指骨
        • 中节指骨
        • 远节指骨

(二)TW(Tanner and Whitehouse)计分法

  1. 在20世纪60年代以前,图谱法逐渐成为制订骨龄评价方法的主流。在探索骨龄标准图谱制订方法的过程中,有人曾经提出测量腕骨的面积和比率的方法评价骨成熟度。虽然这种方法费时,精确性也较差,但是却显露了将骨发育形态特征数字化的萌芽。
  2. 英国牛津大学的Acheson(1954)对图谱法的一些固有问题提出了批评,指出图谱法有以下几个方面的不足:
    • ① 每年龄组只有一张标准片,仅代表了骨化中心的出现和其后发育的一种模式,因此在评价与标准片有不同骨化形式的X线片时,必然要产生主观误差;
    • ② 标准片之间的时间间隔过长;
    • ③ 必须每性别建立一组标准;
    • ④ 使用时间作为评价单位。
  3. 因此他认为,就像分别以吋和磅为单位度量身高、体重一样,骨成熟度也应有自己的度量单位,一个单位应能区分骨的每一明显的形态变化,以每块骨在发育过程中的任一点上所记录的单位总和度量骨成熟度。
  4. 在牛津儿童健康调查(Oxford Children Health Survey,OCHS)研究中,Acheson(1954)引用了膝关节部位以及G-P图谱手腕部位的一些骨成熟度指征为度量单位,为每个单位打分而制定了骨龄评价标准,称这种方法为“牛津法”。
  5. 在牛津法的基础上,英国伦敦大学的Tanner和Whitehouse(1959)根据英国哈彭登生长研究(Harpenden Growth Study)中的儿童手腕部X线片,将每块骨的发育过程划分为8~9个等级阶段,确定了手腕部20块骨的骨发育等级标准系列。等级的划分依据下列成熟度指征:
    • ①骨化中心的出现;
    • ②长骨的骺干融合;
    • ③骨化中心相对大小和相对距离;
    • ④骨化中心各关节面的出现;
    • ⑤骨化中心是否相互接触(点或面的接触);
  6. 1962年,Tanner等(1962)又报告了手腕骨成熟度评价的第二部分,即计分方法。因为手腕部各骨的骨化中心出现以及出现后的骨化速度不尽相同,正常儿童手腕各骨化中心并非处于相同的发育等级上,但不同的骨发育等级对于骨成熟度评价的贡献却应当相同,所以,Tanner等采用了“分类特征计分算法”,使标准化样本中不同骨间得分的总差方和最小化,计算出骨发育等级的分值。后来,Healy和Goldstein(1976)详细地报告了这种计算方法。
  7. 在骨成熟度评价中,对手腕各块骨的权重分配也是一个重要的问题。Tanner等(1962)从生物学角度考虑提出了两个假设:
    • (1)在手腕部,长骨和短骨(腕骨)的发育受不同因素的调控,所以两类骨骼对骨成熟度的贡献各占50%。
    • (2)大量的掌指骨所占权重过大,而且掌指骨发育的方式与时间几乎相同,所以指定第二和第四手指的掌指骨权重为零。
    • 根据上述假设,各类骨的权重分别为:
      • 桡骨、尺骨、第一手指、第三手指、第五手指各占10%;
      • 腕骨占50%,因评价7块腕骨,所以每块腕骨占7.1%。
  8. Tanner等(1962)依据英国平均社会经济水平家庭的2600名儿童的横断资料,采用上述方法制订了英国儿童骨发育评价标准,称为TW1法,被巴黎国际儿童中心协调的欧洲儿童生长研究所采用。
  9. Tanner等(1975)根据对TW1方法可靠性研究的结果,对TW1方法进行了修改,去掉了骨发育等级系统中评价难度较大的桡骨、尺骨、头状骨、三角骨、舟骨、小多角骨的最后一个骨发育等级,同时,为了应用骨龄预测成年身高,分别确立了TW2-20(20块骨)、TW2-RUS(桡骨、尺骨、掌指骨)和TW2-Carpal(腕骨)骨龄标准,而称为TW2法。
  10. 在1983年,Tanner等(1983)又依据扩大的样本(增加了高、矮身高的儿童及正常儿童样本)修改了成年身高预测公式。
  11. 1997年,欧洲儿童生长发育表现出提前的长期趋势,所以Tanner等(1997)开始修订TW2标准。
    • 首先,根据美国德克萨斯州休斯敦经济收入为中上水平家庭的儿童,制订了美国北方欧洲血统儿童的TW-RUS骨龄评价标准,称为US90。
    • 在这篇研究文献中,Tanner等强调了一个重要的观点:“和G-P骨龄不同,骨成熟度分值(skeletal maturity score,SMS)是基础数据,不受长期趋势、社会经济阶层和种族的影响,是对X线片直接的定量描述,和人体测量的身高、体重一样,SMS可以在百分位数图表中标出,……但不同人群的SMS百分位数图表是不同的。”
    • 事实上,这是在世界范围内对TW骨发育等级系列及其成熟度分值的应用效果进行验证后,Tanner所做出的概括与总结。
    • 这种观点在TW方法的第三版专著(Tanner etal.,2001)中得到了充分的体现。
  12. 在US90的基础上,Tanner等(2001)经过对TW2标准及比利时、西班牙、日本、阿根廷、意大利、美国德克萨斯儿童骨发育成熟度的分析比较,在不同年龄段分别采用了原TW2标准、美国德克萨斯州、西班牙儿童的资料,制订了新的骨龄参考标准和评价图表,称为TW3方法。
    • 和TW2标准相比,在10岁以上TW3骨龄提前约1岁,在10岁以下差异较小。
    • TW3法的另一个重要的变动是,放弃了TW2-20块骨的骨龄评价方法,仅分别制订了RUS和腕骨骨龄标准,分别称为TW3-RUS和TW3-Carpal。
    • 在第三版专著中,依据瑞士苏黎世纵断生长研究资料,提出了新的预测成年身高公式。

(三)Fels方法

  1. Fels法也是一种很著名的骨龄评价方法。美国Fels研究所建立于1929年,执行了一项著名的“Fels纵断研究”综合调查计划。
  2. 使用该研究数据,Roche等(1975)曾发表了《膝关节骨成熟度指征》的骨龄计分方法。
  3. 在1986年,Roche等(1988)又使用了类似的方法,依据552名0~18岁儿童的7797张手腕部X线片,提出了评价手腕部骨龄的Fels法。
  4. Fels法评价手腕部22块骨,与TW2-20块骨的方法相比,增加了豌豆骨和籽骨,而且在Fels法的成熟度指征中增加了骨骺和干骺端宽度的测量,采用极大似然率法估价骨龄。
  5. Fels方法重复评价的可靠性可能高于G-P和TW2方法(Vignolo etal.,1992)。但是,与G-P图谱法和TW方法比较,该方法相对复杂,掌握较困难,而且同时包括了手腕部的长骨和腕骨,不能进行RUS骨与腕骨成熟度的比较,因此目前使用者较少。

三、G-P图谱法和TW计分法的比较

在国际间,G-P图谱法和TW计分法都是广泛应用的骨龄评价方法。在长期的应用中,也不断有研究比较分析这两种骨龄评价方法。

(一)两种骨龄标准的组成和尺度不同

  1. TW计分法采用了标准化样本总体方差和最小化的数理统计方法,并对手腕部不同种类的骨分配以不同的权重,将骨发育这一生物学现象转化为数字形式表示。
  2. G-P图谱法采用了骨发育程度中位数方法,手腕部每块骨的权重相同,因此,因掌指骨块数较多,对于骨龄评价的作用相对较大。
  3. 此外,由于两种方法依据不同的人群,骨成熟度的尺度也不同,对同一名儿童,两种方法所评价的骨龄存有差异。
  4. 骨成熟度尺度的差异也反映在骨龄速度上,骨龄速度可以由骨龄(SA)与生活年龄(CA)的比值表示。
    • Fry(1971)曾经测定了233名10~16岁中国香港儿童的骨龄速度
      • GP SA/CA值为0.74~1.26
      • TW SA/CA值为0.73~1.45
    • TW法的骨龄速度较高,但在不同年龄上两种骨龄速度的可变性都较大。

(二)两种骨龄方法的评价误差不同

  1. 20世纪60年代,巴黎国际儿童研究中心为选择骨龄评价标准,特别对G-P图谱方法和TW1方法做了系统的研究。Acheson等(1963;1964;1966)选择了来自不同国家的8名骨龄评价者(6名有经验者,2名无经验者),采用上述两种方法评价50名2~18岁儿童的手腕X线片。得出如下的结论:

      1. G-P图谱法的主观成分较大。
      • G-P图谱中的每张标准片只代表了这一年龄儿童的一种骨发育形式,所以,图谱法将骨化中心最初的出现及其后的发育、成熟都假定为固定的模式。
      • 当然,手腕部骨化中心以一定的次序出现,而且后来的形态发育特征和骺干融合也有普遍的规律。
      • 但是也有相当多的材料证明,由于遗传原因骨化形式有相当大的正常变异,不同人群也存在不同类骨发育速度的差异,某些疾病也会引起骨发育形式的改变。
      • 因此,就会出现被评价者的许多X线影像表现与标准片不一致的情况,在做比较时二者不会完全匹配。所以在采用整片匹配或插入法时,主观判断的成分必然加大。
      1. G-P图谱法有较小的系统误差,TW1方法有较小的随机误差。
      • 在不同方法的比较研究中,Acheson等发现,使用TW1法骨龄读数的95%置信区间小于G-P法;各评价者使用G-P法的最高和最低骨龄平均数的范围小于TW1法。
      • 骨龄评价方法误差表现不同,可能与G-P法的整片匹配而TW1法的逐块骨匹配的读片方法有关。
      • G-P图谱法只对手腕所有骨做一次整片匹配,如果出现错误,那么骨龄读数相差必然较大。
      • 而TW1计分法要连续做20次评价,如果出现一次错误,所造成的得分误差对骨龄的影响则较小,所以随机误差较小;
      • 但是,如果一名评价者使用TW1法时有过高或过低的倾向时,就将随骨块数的增多而加大骨龄读数的偏差,因而增大了TW1法的系统误差。
      1. 如何使用G-P图谱法对随机误差也有一定的影响,当使用G-P图谱插入法时,骨龄读数的95%的置信区间比使用整片匹配法低25%。
      1. X线片的阅读难易程度也对随机误差有一定的影响。
      • 在Acheson等的研究中包括部分患病儿童的手腕部X线片,不同骨间的成熟度差异较大,更不易与标准片相匹配,所以在评定中也必然有更大的主观成分而加大误差。
      • 另外,如果在评价中排除腕骨,TW1方法的偏差(系统误差)大大下降。
  2. TW2计分法中取消了评价困难的骨发育等级,并分别建立了TW2-RUS和TW2-Carpal标准,可能更有利于减小评价误差,在实践应用中更为可取。

  3. 在早期的G-P图谱和TW方法的比较研究中,大都为研究工作者评价骨龄。但在临床中,骨龄评价的实际情况却有很大的不同。

    • 在King等(1994)的研究中,3名评价者使用G-P图谱和TW2法,评价者本人重复读片的骨龄差值为:
      • TW2法0.74岁
      • G-P法0.96岁
      • 二者差异在0.05水平上显著
    • 英国剑桥大学阿登布鲁克教学医院的Bull等(1999)研究表明,362张X线片的G-P骨龄和TW2骨龄显著不同;
      • 重复阅读10%的X线片,使用G-P图谱方法的误差大于TW2方法,使用整片匹配的方法是G-P骨龄最重要的误差来源。
      • 重复读片的骨龄差值:
        • G-P法:0.14±1.16岁,95%置信区间为-2.46~2.18岁
        • TW2法:0.01±0.71岁,95%置信区间为-1.41~1.43岁
    • 最近,Yikliz等(2011)的研究也证明,在每年处理600~1000骨龄X线片的小儿内分泌科,使用基于Web的TW2骨龄计算软件,重复读片的可变性显著小于G-P法,说明使用G-P整片匹配方法评价骨龄的准确性不如TW2计分法。
      • 重复读片的骨龄差值:
        • TW2法:-0.04±0.21岁,95%置信区间-0.45~0.37岁
        • G-P法:0.10±0.44岁,95%置信区间-0.77~0.97岁
      • 而且,TW2方法评价每X线片的时间由过去的平均9分钟减少到2.4分钟,建议在临床中使用TW计分法,特别是在追踪个体病人骨龄的变化时。因此,随计算机应用的普及,G-P图谱方法逐渐失去了其简单、省时的优点。
  4. G-P整片匹配方法与TW计分法的比较总结于表2.1。

    表2.1 G-P图谱法和TW计分法的优缺点

    G-P图谱法 TW计分法
    每年龄组仅有一种发育模式:主观性过大 可适应每种发育模式:主观性较小
    可靠性较差 可靠性较好
    主要依据的骨不确定:可比性较差 同定次序评价同一组骨:可比性较高
    标准片间隔大:骨龄为非连续的数值 骨龄基本为连续数值
    不利于掌握手腕骨成熟度指征 必须学习、掌握手腕骨成熟度指征
    忽略了不同骨发育程度的差异 可分別评价RUS和腕骨的骨龄
    学习简便,评价省时 需要一定时期的学习,使用计算机计算程序能够节省时间
  5. 综上所述,不能绝对地说哪种方法好,哪种方法不好。不同人偏爱使用哪一种方法也与其从事的专业与使用目的有关。

    • Roche(1967)因为要利用X线片上所有的信息而喜欢G-P图谱法,Anderson(1968)使用G-P图谱法是因为能够很快地学习掌握,也同样能够达到研究骨的成熟与身高、性发育和社会经济条件相互关系的目的。
    • Malina和Little(1981)使用TW计分法是因为要研究黑人和白人儿童每块骨发育差异,所以选择了更好的标准化度量系统。
  6. 许多专业领域应用骨龄评价标准,一般可以归纳为临床应用和研究问题两种主要类型。

    • 临床专业所关心的是病人发育“提前”或“延迟”的程度以及正常变异范围,或是儿童是否已经停止生长,或是疾病引起成熟度的变异等。
    • 所以,为临床目的而应用骨龄时,评价方法的准确性和精确性是很重要的,特别是对治疗效果的监控更是如此,否则评价误差将掩盖真实的成熟过程,导致错误的诊断与治疗。
    • 另一类是研究工作者,应用骨成熟度评价作为研究工具,所以骨龄评价的准确性和精确性更加重要。
  7. 从专业角度出发,无论选择哪一种骨龄评价方法,都必须了解方法假设基础的局限性及评价误差,更重要的是不要忘记G-P图谱法和TW计分法骨龄标准来自于不同的人群。

四、G-P图谱法和TW计分法在世界范围内的检验与应用

五、骨成熟度评价方法中所存在的某些问题

(一)将非连续的骨发育等级应用于连续的骨发育过程

  1. 计分法根据骨发育过程中的形态变化,武断地划分为若干发育阶段,每个阶段即为一个发育等级。
  2. 在骨发育通过每一等级的过程中,骨的发育并没有停止,但是骨发育等级不变。
  3. 在图谱法中也存在这样的问题,因各标准片中的每块骨的成熟度指征即相当于一个发育等级。

不同骨化中心出现的早晚及其出现后的骨化速度不同,所以骨龄评价部位的各骨 化中心不会同时处于相同的发育等级上,因而可区分出不同个体发育程度的差异。但在进 入青春期后,长骨的骨化进程逐渐接近,同时达到同一成熟度指征。例如,在身高速度高峰 后手腕部腕骨已发育成熟,掌骨的发育达到骺干等宽,桡骨、指骨均达到骨骺覆盖骨干的发 育阶段,而出现“齐头并进”的现象。在这一发育期间虽然骨的发育没有停止,但因骨发育 等级无变化,骨龄读数不变。这种状况持续一段时期后,各块骨陆续进入融合阶段。因此, 骨成熟度指征的提取、骨发育等级的划分仍然有待于研究,以减轻骨发育等级非连续的 程度。

(二)

(三)

(四)

(五)