说明:
1. 翻译自van Wulfften Palthe OD, Houdek MT, Rose PS,et al.How Does the Level of Nerve Root Resection in En Bloc Sacrectomy Influence Patient-Reported Outcomes?.Clin Orthop Relat Res,2017,475(3):607-616.
一、前言
手术切除是骶骨原发恶性肿瘤治疗的重要组成部分。
骶骨切除术通常涉及骶神经根的切除,这会导致下肢、肠道、膀胱和性功能障碍。
已经从生理学角度研究了这些结果。
- 例如,已经报道使用测压法(manometry)和膀胱测压法(cystometry)对肠道和膀胱功能的定量变化进行了研究。
其他研究的结果基于对术前和术后病历的回顾性研究,将结局简单二分类。
大多数研究都集中在关键的肿瘤学结果上,但只是简单地讨论了通常客观的功能测量的结果。
患者自我报告的结果在确定治疗成功是否方面变得越来越重要。
- 在许多医学领域,包括脊柱外科领域,研究越来越多地关注患者报告的结果以及针对特定患者群体的问卷调查的妥善性(adequacy)。
- 这些结果很重要,因为它们不会被治疗医生选择性地过滤,并能够对患者身心健康的定性数据进行定量评估。
目前的研究还考虑了神经根切断的水平,而不是截骨的水平。
- 截骨的水平并不总是与神经根切断的水平相对应。
- 根据肿瘤的受累,有可能牺牲单侧的神经根,而不是像截骨术暗示得那样会牺牲双侧神经根。
- 类似地,肿瘤可以累及神经根的更远端部分,这使得截骨的范围更靠近尾端,而神经根切断的水平更靠近头端。
已知保留单侧神经根,就能够保留足够的神经功能。
此外,目前还没有就何时应该对接受高位骶骨切除术的患者使用结肠造口术(colostomy)做出共识,而这一决定主要取决于外科医生的经验。
- 在做出这一决定时,没有结肠造口术的患者和有结肠造口术的患者,两者报告的结果可能是有价值的。
本研究旨在评估全骶骨切除术后患者自我报告的结果在下列各方面的差异:
- 心理健康(mental health)
- 身体健康(physical health)
- 疼痛强度(pain intensity)
- 疼痛干扰(pain interference)
- 性功能(sexual function)
- 基于神经根切除水平的胃肠功能(bowel function)
其次,我们的目的是评估有或没有结肠造口术的患者之间的心理健康,身体健康和疼痛之间的差异。
二、患者和方法
收集2012年2月至2014年10月期间的患者,这些患者在2000年6月至2013年8月期间接受了transverse sacral resections,排除了接受hemipelvectomy或hemisacrectomy的患者。
骶骨脊索瘤非常容易复发,因此在评估生活质量时纳入骶骨脊索瘤患者非常重要。74例患者的病理类型分布:
病理类型 例数 占比 腺癌(adenocarcinoma) 9 12% 骨巨细胞瘤 3 4% 软骨肉瘤 3 4% 骨肉瘤 2 3% 脊索瘤(chordoma) 58 78% 这代表了39%(58/149)的患者为骶骨脊索瘤,在此期间接受了transverse sacral resections。
2000年6月至2013年8月期间接受手术的27例(18%)患者死亡,未纳入本研究。
在2012年2月至2014年10月期间,122例活着的患者中有38例(31%)因为他们处于不同的随访时间表或他们已将图像直接发送给经治医生而未在诊所进行检查。
在诊所接受检查的患者中:
- 20例(16%)失访。6名(5%)患者进行了不到6个月的随访或未完成所有主要结局指标的随访。
预期能够恢复胃肠和膀胱功能及其独立行走的能力的患者,通常在术后6个月内可以恢复,并在此后保持稳定,没有太大的变化。
切除手术和完成随访调查之间的中位时间为59个月(范围为6-255个月)。
- 每种类型肿瘤的切除目标是获得阴性边缘。
- 通常这是通过在有或没有辅助放疗的情况下在肿瘤边界外1cm截骨来实现的。
- 神经根切除由肿瘤位置决定。
(一)患者
- 回顾手术记录,以确定哪些神经根被切除。
- 有5例患者,两侧之间存在1个神经根的差异。
- 有1例患者,两侧之间存在2个神经根的差异。
- 对保留单侧神经根的患者按照保留双侧神经根进行治疗。
- 该决定是基于先前研究的结果,这些研究表明保留单侧神经根不会影响整体的临床功能。
- 远端骶骨切除术的患者很少接受结肠造口术治疗。因此,我们排除了远端骶骨切除术的患者中结肠造口术与无结肠造口术的比较(即S3和S4组)。
- 将来自高位骶骨切除术的患者(即L5,S1和S2)的所有数据合并,并根据在随访完成时存在结肠造口术分成两组:
结肠造口术(N = 18)
无结肠造口术(N = 28)
(二)结局变量
- 本调查中使用的调查问卷基于2012年在美国明尼苏达州罗切斯特市梅奥诊所举行的会议期间达成的共识。所有调查均由患者自行完成。
- 本研究使用的调查主要包括来自美国国立卫生研究院患者报告结果测量信息系统(Patient Reported Outcome Measurement Information System,PROMIS)的调查问卷。
- 使用的PROMIS问卷是整体项目简表(the Global Item Short Form),分为:
- 心理和身体健康领域(N = 74)
- 疼痛强度简表3a(N = 71)
- 疼痛干扰简表6b(N = 71)
- 性功能概况v1.0-男性和女性(N = 70)
- 满意度(satisfaction)(N = 20)
- 兴趣(interest)(N = 70)
- 勃起(erection)(N = 21)
- 润滑(lubrication)(N = 5)
- 阴道不适(vaginal discomfort)(N = 5)
- 性高潮(orgasm)(N = 35)
- 除了兴趣interest领域以外,其他所有选项都有“在过去30天内没有尝试过...”作为选项之一。
- 这个特定的回答选项会使领域无法计算分数。
- 唯一的非PROMIS调查问卷是改良梗阻-排便评分(Modified Obstruction-Defecation Score,MODS)(N = 49)。
- 若患者完成多次调查则选择日期最近的一次调查数据用于分析。未收集这些患者的术前数据。
- 通过REDCap(Vanderbilt
University,Nashville,TN,USA)收集随访期间的数据,并使用评估中心(https://
www.mempagecenter.net)收集通过邮件联系的患者资料。
- REDCap和评估中心(Assessment Centre)是在线数据收集工具,使研究人员能够创建针对特定研究的调查,从而能在线安全地获取研究参与者的数据。
- 使用公开可用的评分手册对PROMIS问卷进行评分并转换为T评分。根据PROMIS指南处理缺失的分数(每个问卷都有所不同)。
- 较高的T分数表示正在测量的度量较大,如更高的疼痛干扰分数意味着更多的疼痛干扰。
- PROMIS T评分被标准化并校准到美国普通人群。这能够将收集的数据与普通美国人群的平均得分进行比较(其被标准化为T评分为50,SD为10)。
- 性高潮领域没有T分数,因此无法与普通美国人群进行比较。
- 相反,通过对各个领域的分数求和来计算初始分数(raw score)。
- 类似地,通过对所有八个项目的得分求和来对MODS进行评分。
- 为了提高患者报告结果(patient-reported
outcomes)的可解释性,重要的是要知道哪些差异大到足以对患者的治疗或护理产生影响。
- 这由最小临床重要性差异(minimal clinically importance difference,MCID)确定。
- 需要进行大量的研究来确定MCID。
- 遗憾的是,这些特定的工具还没有完成。
(三)统计学方法
- 使用Mann-Whitney U检验比较两组。
- 使用Kruskal-Wallis检验,检测两组以上的差异。
- 如果检测到差异,则使用Dunn’s test进行多重成对比较(multiple pairwise comparison)。
- 使用Benjamin-Hochberg方法控制错误发现率(false discovery rate)。
- 我们接受10%的错误发现率,这转化为当q<0.10时成对比较有显著的统计学意义。
- 该方法确保不会过度分析数据。最近的研究表明,纠正错误发现率是控制多重比较的更有效方法,并为得出有关统计显著性的结论提供了坚实的基础。
- 错误发现率控制是一个有吸引力的替代方案的原因是它明确地控制了显著结论(significant results)中的检测结论(test conclusions)的错误率(error rate)。
- The exact sign test用于比较每组患者分值的中位数与普通美国人群的标准化平均分数。
- 对于结肠造口术与无结肠造口术比较,进行了事后功效分析(post hoc power
analysis),其中α设置为0.05,以确定在下列各方面获得功效:
- 心理健康(power: 0.05, delta: 0.60)
- 身体健康(power: 0.16, delta: 2.3)
- 疼痛干扰(power: 0.05, delta: 0.30)
- 为了达到0.80的功效,假设具有相似的delta和变异性,我们需要大样本量来检测差异:
- 心理健康(7792名患者)
- 身体健康(328名患者)
- 疼痛干扰(18,155名患者)
- 根据目前的样本量,我们会发现差异的条件:
- 心理健康状态的delta超过8.3
- 身体健康状况的delta超过6.5
- 疼痛干扰的delta超过8.3时
三、结果
(一)研究队列与骶骨脊索瘤队列的比较
- 我们将来自我们研究队列的人口统计学数据与来自三个机构的所有骶骨脊索瘤患者进行了比较。
- 年龄方面
- total: 57
- SD: ± 15
- study: 57
- SD: ± 16
- p = 0.888
- total: 57
- 性别
- total male: 68%
- study male: 72%
- p = 0.999
- 肿瘤体积(以毫升计)
- total: 511
- SD: ± 1307
- study: 380
- SD: ± 829
- p = 0.416
- total: 511
- 年龄方面
(二)不同神经根水平的身心健康
我们的主要结局指标是PROMIS整体调查问卷的心理健康领域和身体健康领域。
心理健康领域(L5/S1/S2均显著低于S3/S4,且5组与美国普通人群相比无差别)
- 成对亚组比较显示,没有保留骶神经根的患者(median = 46, IQR = 39–53)心理健康评分显著低于保留至S3神经根的患者(median = 53, IQR = 48–63, p = 0.094)和保留至S4神经根的患者(median = 56, IQR = 46–63, p = 0.053)。
- 保留至S1神经根的患者心理健康评分(median = 46, IQR = 44–59)显著低于保留至S4神经根的患者(median = 56, IQR = 46–63, p = 0.053)。
- 保留至S2神经根的患者心理健康评分(median = 44, IQR = 41–51)显著低于保留至S3神经根的患者(median = 53, IQR = 48–63, p = 0.094)和保留至S4神经根的患者(median = 56, IQR = 46–63, p = 0.053)。
- 与美国普通人群相比(mean = 50, SD = 10),没有一组具有不同的心理健康状况。
身体健康领域(L5/S1/S2均显著低于S3/S4,L5/S1低于美国普通人群,S1最低,S4最高)
保留至S1神经根的患者的身体健康评分最低(median = 42, IQR = 37–48) ,保留至S4神经根的患者的身体健康评分最高(median = 54, IQR = 51–62)。
我们的分析发现,保留神经根较少的患者中,身体健康状况越差,各组之间存在差异。
亚组分析显示,没有保留骶神经根的患者(median = 44, IQR = 37-48) 的身体健康评分低于保留至S3神经根的患者(median = 47, IQR = 45–54, p = 0.024),也低于保留至S4神经根的患者(median = 54, IQR = 51–62, p = 0.068)。
保留至S1神经根的患者(median = 42, IQR = 37–48) 的身体健康评分低于保留至S3神经根 (median = 47, IQR = 45–54, p = 0.0081) 和S4神经根(median = 54, IQR = 51–62, p = 0.0045)的患者。
保留至S2神经根的患者 (median = 42, IQR = 40–51) 的身体健康评分低于保留至S3神经根 (median = 47, IQR = 45–54, p = 0.043) 和S4神经根 (median = 54, IQR = 51–62, q= 0.0095)的患者。
没有保留骶神经根的患者和保留至S1神经根的患者,身体健康评分低于普通美国人群 (mean = 50, SD = 10)。
(三)不同神经根水平的疼痛评分
在疼痛干扰评分(Fig. 2; p = 0.653) 或疼痛强度评分(Fig. 2; p = 0.286)方面,组间没有检测到差异。
我们的患者样本与美国普通人群之间存在差异(mean = 50, SD = 10)。
保留至S3神经根的患者疼痛强度评分低于 (median = 45, IQR = 41–49, p = 0.012),美国普通人群的评分 (mean = 50, SD = 10)(Fig. 2)。
(四)不同神经根水平的胃肠和性功能评分
两组间改良梗阻-排便评分无差异。
两组间下列方面没有差异:
- 满意度(satisfaction)(N = 20)
- 兴趣(interest)(N = 70)
- 勃起(erection)(N = 21)
- 润滑(lubrication)(N = 5)
- 阴道不适(lubrication)(N = 5)
就性高潮(orgasm)而言,各组之间存在差异(p = 0.033)。
(五)伴或不伴有结肠造口术的患者
根据可获得的数据,我们发现两组在心理健康,身体健康或疼痛干扰方面没有差异(Table 3),但均显著低于美国普通人群。
然而,如前所述,这些比较的统计效力(statistical power)非常低。
四、讨论
(一)局限性
- 首先,由于多种原因,我们无法对所有符合条件的患者进行调查。
- 主要原因是在研究期间没有在诊所看到病人。这并不直接暗示这些患者的健康状况。可能是患者处于不同的随访时间表,或者患者直接把影像资料发送给了经治医生。
- 我们能够从三个机构合计调查48%的骶骨脊索瘤患者。为了检测这是否是一个有代表性的样本,我们将我们样本的人口统计学数据与所有骶骨脊索瘤患者进行了比较,发现在年龄,性别或肿瘤体积方面没有差异。
- 其次,我们没有收集患者术前的心理健康,身体健康,疼痛,性功能和胃肠功能的数据。
- 因此,骶骨肿瘤手术对患者生活质量的实际后果的比较很难(如果不是不可能的话)进行衡量。
- 例如,一些患者在手术前可能表现出较差的生活质量,若仅在术后衡量其生活质量,就可能会导致错误的评分。
- 此外,患者也可能具有较高的术前生活质量,在这种情况下,类似的手术可能会产生更大的影响。
- 尽管假设这些差异在每个组中都存在,但各组之间的比较是一种有效的方法。
- 我们的患者没有在统一的随访时间内完成调查。
- 在本研究中最少6个月的随访后,患者的健康状况仍可能发生变化。
- 这6个月的时间间隔基于之前的研究,表明大多数患者在6个月后恢复良好的运动,胃肠功能和膀胱功能。
- 我们之所以选择6个月,是因为我们认为此时神经功能损伤通常是稳定的,并且此时患者通常已从手术中恢复过来。
- 考虑到我们随访的平均值为59个月,因此潜在的混杂效应该是最小的。
- 我们将接受高位骶骨切除术的患者根据随访时间分为两组,未发现两组之间的差异。
- 一组随访不到1年(6例)
- median mental health: 40.0
- IQR: 39–46
- 一组随访超过2年以上(30例)
- median physical health: 37.4
- IQR: 37–37
- 一组随访不到1年(6例)
- 我们使用的问卷没有具体涉及某些方面,例如膀胱功能。我们目前正在收集患者和专家认为是生活质量调查中应该解决的重要方面的定性数据。
- 此外,并非所有患者都完成了所有问卷中的所有问题,因此,无法计算某些分数。
- 虽然这些数字对疼痛干扰评分(4个无评分,5%)和疼痛强度评分(4个无评分,5%)而言较小,但对MODS评分而言则较大(25个评分缺失,34%),且大幅减少的样本量使分析的效力降低。
- 最后,可能并非所有统计学上显著的差异都具有临床重要性。
- 我们发现基于神经根切除水平的心理健康存在差异。因为我们没有将患者分为高位和低位骶骨切除,所以L5组和S4组之间的差异似乎是非常明显的。
- 还观察到S2组和S3组之间的心理健康相对大幅下降。当牺牲S3神经根时,会导致精神健康水平的降低。
- 不幸的是,没有MCID值来确定这种差异是否具有临床重要性,尽管我们怀疑这种大小的差异 (Fig. 1) 在临床上很重要。
- 对于身体健康评分也发现了类似的结果,这些结果表明,牺牲S3神经根会降低患者的身体健康。
(二)结论分析
- 我们发现,比较基于骶神经根被牺牲的患者自我报道的结果时:
- 当双侧S3神经根以下被牺牲时,患者的精神和身体健康显著降低。
- 当牺牲双侧S2以下的神经根时,发生性高潮的能力显著下降。
- 在高位骶骨切除术的患者中,有或没有结肠造口术的患者在心理健康,身体健康和疼痛干扰方面没有差异。
- 从生理学角度进行的一些研究表明,S3神经根的保留对于保持肠道,膀胱和性功能的正常是必需的。
- 这可以解释S3被牺牲时对身心健康的影响。
- 这并没有解释为什么我们发现L5和S1组之间没有差异,因为保留S1神经根对维持下肢功能至关重要。
- 这可以通过以下概念来解释:患者报告的结果始终是患者自己的感知。因此,关于身体功能(physical function)的问题中的“常规活动”对于那些在几年前失去走动能力的患者来说可能意味着一些非常不同的事情,而那些仍然可以活动的患者来说可能显得较为平常。
- 为了测量疼痛,我们使用了PROMIS疼痛干扰和疼痛强度,分别评估疼痛对患者生活相关方面的影响和患者疼痛的程度。
- 先前的研究中并未经常描述疼痛。
- 但我们的研究结果表明,与普通美国人群相比,保留神经根较少的组(即L5,S1和S2)在其生活相关方面产生了更多的疼痛导致的后果。
- 除S3组外,我们的研究组与普通美国人群之间在疼痛程度(疼痛强度评分)方面没有差异。
- S3组报告的疼痛程度低于普通美国人群。
- 疼痛强度包括三个问题,即:
- 患者在过去7天内的平均疼痛程度和最严重疼痛程度。
- 患者目前的疼痛程度。
- 缺乏差异的解释可能是:
- 本研究中相当长的平均随访时间(52个月)。
- 可能是因为这些患者在手术前接受过宣教并且多年来一直生活在疼痛中,与普通美国人群相比,他们对疼痛的感受不同。
- 这可以解释为什么我们确实看到疼痛强度评分降低到甚至比普通美国人群更好的分数。
- 有趣的是,疼痛干扰评分确实因较高的切除水平而有所不同。
- 这可能意味着患者不再感受到剧烈的疼痛,而是在日常生活中感受到更多的麻烦。
(三)调查问卷的妥善性
- 我们没有分析调查问卷对这一特定患者人群的适当性。
- 似乎疼痛干扰问卷纳入更多与患者组相关的问题。
- 性功能问卷有六个领域,其中五个可以通过选择上个月内缺乏性交来选择退出。
- 这使每个领域的应答很少,特别是女性特定的领域。
- 当保留的神经根越多,选择此选项的患者越少。
- 可能性功能较差的患者发现这些问题太过面对,并选择退出。
- 并非所有组都具有达到性高潮的相同能力。早期的研究表明,保留S2对于保持达到性高潮的能力是必要的。这支持了我们的研究结果。
- 当S2被牺牲时,达到性高潮的能力下降。
- 虽然高潮评分不是标准化的,因此无法与普通美国人群进行比较,但比较研究组之间的原始评分仍然是有效的。
- 用于评估肠道功能的问卷(即MODS)仅涉及排便和梗阻。
- 虽然保留的神经根越多,梗阻症状越少。但由于每组内的变异性很大,我们没有发现统计学差异。
- 我们不认为这份问卷涵盖了肠道功能的所有方面,这将在目前骶骨肿瘤调查问卷的重新开发中得到解决。
(四)临床应用价值
- 我们的数据证实了先前的研究,即S3神经根在保存功能方面的重要性。
- 当根据肿瘤的位置需要切除S3神经根时,应该与患者进行术前讨论,讨论其对身体和精神功能的潜在影响。
- 至少可以讨论如何应对对患者身心功能的预期压力。
- 由于疼痛是癌症患者自然而然关注的问题之一,因此本文提供的数据应纳入术前讨论。
- 接受低位骶骨切除术的患者可以被告知疼痛通常不是手术的长期后果。
- 接受高位骶骨切除术的患者更容易出现干扰其生活的疼痛。
- 这些患者可能会受益于关于应对机制的术前讨论,也许可以看到临床医生在手术前接受过疼痛心理学和疼痛管理方面的培训。
- 此外,这里提供的数据可以作为与疼痛临床医生(pain clinicians)就未来减轻疼痛的策略进一步讨论的基础。例如,将鞘内止痛泵放置在手术区域之外。
- 我们的数据还显示,尽管样本有限,但使用结肠造口术可能无法改善整体生活质量。
- 显然,结肠造口术有一些优点,例如手术切口的污染减少。
- 然而,大多数患者似乎需要适应结肠造口术,并且使用结肠造口术不会改善整体生活质量。