一、方差(Variance)

（一）总体方差

\[\sigma^2=\dfrac {1}{N}\sum ^{N}_{i=1}\left( x_{i}-\mu \right) ^{2}\]

（二）样本方差

\[s^2=\dfrac {1}{N-1}\sum ^{N}_{i=1}\left( x_{i}-\overline {x}\right) ^{2}\]

二、标准差(Standard Deviation,SD)

（一）总体标准差

\[\sigma=\sqrt{\dfrac {1}{N}\sum ^{N}_{i=1}\left( x_{i}-\mu \right) ^{2}}\]

（二）样本标准差

\[s=\sqrt{\dfrac {1}{N-1}\sum ^{N}_{i=1}\left( x_{i}-\overline {x}\right) ^{2}}\]

三、标准误(Standard Error,SE)

（一）标准误和标准差的联系

标准误也是标准差。

（二）标准误和标准差的区别

标准差是衡量某一次抽样得到的一个（样本量为N的）样本里所有个体之间的区别。
标准误是衡量多次抽样得到的很多（样本量均为N的）样本（各自的平均值或其他统计量）之间的区别。
- 标准误衡量的是抽样分布的离散度，比如样本均值的标准误(standard error of sample mean)，衡量的就是样本均值的离散度。

（三）计算公式

样本均值的标准误 \[SEM(S_{\overline {x}}) = \dfrac {s}{\sqrt {N}}\]
样本均值之差的标准误 \[\sqrt {\dfrac {S^{2}_{A}}{n_{A}}}+\sqrt {\dfrac {S^{2}_{B}}{n_{B}}}\]

在临床实践中成就卓越——如何提高你的临床效果

发表于 2018-08-17 更新于 2019-02-28 分类于临床实践

说明：
1. 翻译自Joel M. Matta, M.D.的文章Excellence in Clinical Practice: How to Improve Your Clinical Results.Journal of Orthopaedic Trauma,2005,19(6):p432-434.
2. 译文部分参考自丁香园的帖子：Joel M. Matta大师的教义和作为一个普通的创伤骨科医师的我的感悟

Dr. Joel Matta is an Orthopaedic Surgeon Practicing Hip and Pelvic Reconstruction. He is the founder and director of the Hip and Pelvis Institute at St. John’s Health Center in Santa Monica, Calif. A veteran of 35 years in the practice of orthopaedic surgery, Dr. Matta also is the founding President of the Anterior Hip Foundation. He has published more than 30 articles and studies on the advancement of techniques and methods used to simplify and improve hip replacement, pelvic and acetabular fracture treatment and periacetabular osteotomy.

一、什么是卓越的临床效果

What is the formula for excellence in orthopaedicclinical practice? Certainly, there is no set formula for everyone. These aremy thoughts based on what I have learned from others, as well as my personal experience.

什么是能在骨科临床实践中成就卓越的公式？诚然，对所有医生而言没有固定的公式。以下这些是我基于学习他人及个人经验的一些思索，谨供参考。

There are a number of ways that excellence can be measured, but I think the most important one is the benefit or the clinical results that we provide to our patients. Excellent clinical results exist in many settings and are not necessarily related to the notoriety of the surgeon or institution.

有许多可以衡量临床诊疗卓越性的途径，然而，我认为其中最为重要的一条是我们医生能提供给病人的益处或临床结果。在很多种情况下，均可产生卓越的临床效果，其并非一定与外科医生或诊疗机构相关。

二、把激情和热爱放在首位，而不是赚钱

My first recommendation is to pursue a type of practice based on your passion. You should find your niche according to your interests and abilities.

我的首要建议是追求一种自己有激情且这种激情能够扎根的临床实践。根据兴趣和能力找到自己的临床实践领域。

Monetary reward will influence our activities to a degree; However, you sell yourself short if you place money first. Fortunately,in orthopaedics we can “have our cake and eat it too.”

金钱报酬会在一定程度上影响我们的临床诊疗行为；然而，当你将金钱放在首位时你就把自己的短板暴露无遗。庆幸的是，在骨科领域我们可以拥有自己的“蛋糕”并可以享用它。

Our specialty allows us to enjoy our work as much as sport, gain personal satisfaction and community recognition, and also be well compensated. I think the key to all of these benefits is our passion and commitment to our work. There are few careers available that combine the pleasure of both manual and intellectual challenges.

我们的专长允许我们像享受运动一样享受我们的工作，得到个人的满足和社会的认同，当然也可以获得很好的报偿。我想我们能得到这些实惠的关键在于我们对临床工作的激情和担当。世上没有多少职业能将挑战智力和体力的乐趣有机结合起来的。

注：金钱的私欲是医生的短板。就此短短一截的距离即可使你对卓越的临床实践难以企及。就像Matta教授说的，金钱不是追求，而是你有所成就后的自然而然的回报；这种回报的对象，即医生，是被动的（be well compensated）。我们自己的蛋糕，即骨科领域，有着丰富的回报足以让我们享用。得到回报的前提是作为医者的你对临床工作的激情和担当。

三、与患者充分的沟通

Although we are surgeons, and the job we do in the operating room is probably the most important, we also must take pride in our one-on-one skills with patients. If patients are able, the more that they understand about their problem, the better. Detailed preoperative and postoperative explanations can help the final result. I also rely on patient-information publications and my own website to inform the patient and family.

作为外科医生，尽管我们在手术室所做的工作可能是最重要的，但是我们必须对我们有与病人面对面交流的能力引以为傲。如果病人拥有能动性，他们知晓自己存在的问题越多越好。因为，术前和术后详尽的沟通可益于最终的治疗结果。除了面对面的沟通外，我还借助病人诊疗信息出版物和我自己的网站对病人及其家属进行告知。

四、全面细致的检查，仔细耐心的聆听

The surgeon must be disciplined regarding their physical examination of the patient with acute high-energy trauma. The patient should be completely undressed and all skin areas visualized. In addition to a complete and detailed neurovascular examination, all the extremities that do not have an obvious deformity should be palpated and moved. Use x-rays liberally.

医生必须严格自律于对急性高能量损伤病人的体格检查。检查时需要脱去病人所有衣物，检视其每一寸肌肤。除全面、细致的神经血管功能检查外，还需要触诊和活动所有无明显畸形的肢体。要不吝进行X线检查。

For the subacute or chronic problem,listen carefully to the patient. You need to always assume that the patient is telling the truth and is not crazy or a “crock.” There are many problems that we don’t yet understand,and everyone does not fit neatly into a category. Many old trauma problems,such as malunions and nonunions, require a unique solution that you need toinvent. The extra time that you spend in planning and consultation in these patients will make a difference.

对亚急性或慢性病损，医生需要仔细的聆听病人的陈述。你需要总是假定病人是在述说实情而非夸大事实或“闷罐”一样有所隐瞒。有很多问题我们尚不甚了解，而且也不能对每一病例简单清晰地归类。许多陈旧创伤所导致的问题，诸如畸形愈合和不愈合，需要你制定一个独一无二的解决方案。对这些病例进行询诊和制定方案所精心花费的额外时间将会使治疗结果变得不同。

五、若无法提供帮助以改善患者的现状，实话实说

At times we find ourselves at a loss with patients, particularly those with chronic pain problems who often will say “you’ve got to do something” or “I can’t live likethis.” The justification for surgical treatment should not be based on such desperate reasoning. Surgery should always have a probability of success when undertaken. In some situations, you may have nothing to offer the patient, and in that case it is best to say so.

有时候我们会对一些（我们治疗过的）病人，特别是那些存在慢性疼痛的患者，会说“医生，你需要再为我做些什么”或“我不能这样活着”的病人，感到迷失。事实上，外科（手术）治疗效果的评判不可基于这样不顾一切的理由。一旦实施，手术总会有成功概率。在某些情况下，你可能无法提供给病人任何帮助以改善其现状；而此时，你最好实话实说。

In a few cases, I have gone so far as to tell patients that they should quit seeing doctors before somebody operates on them. A large proportion of these difficult patients are chronic narcotic users. I believe it is our responsibility to limit prescription of these medications to acute or terminal situations, such as neoplasm.

在少数情况下，我甚至告知病人说他们需要在有人为他们做手术之前停止四处就医。这类棘手病人的大多数都长期服用麻醉剂。而我认为我们有责任为急性期或终末期病人，如肿瘤病人，限制开具这类药物处方。

注：医学科学有发展的限制，医生有知识和理解力的限制，这些造成手术必然存在成功的概率。医生所做的就是在诸多限制的情况下尽己所能使病人得到最大的临床效果。也正因为这些限制而使得有时候你没有能力去改善病人的现状而使其受益。那么，你该怎么办？为了挽留病人、满足私欲而强撑（最终必然是效果不佳），还是告知其实情（你真的没有能力）并协助其寻找更好的帮助？我想，随着不断的学习、领会、悟道和实践等，个人能力方面的限制就会变得越来越少且能为病人提供服务的质量就会越来越高。

六、手术一定要有指证

Be an expert in the interpretation of x-rays,CT, and magnetic resonance imaging. These imaging studies combined with the clinical factors provide the main indications for surgery.

Have indications for surgery; do not operate just because a fracture is present. The integrity of you and our specialty suffers with the application of faulty indications for surgery. Operating without the proper indication is not justunethical, it is an assault.

我们需要成为阅读和理解X线、CT和磁共振影像的专家。与临床症征相结合，这些影像资料的研读提供了主要的手术指证。手术需要指证；不能仅仅因为骨折的出现而实施手术。因错误的指证（或无指证）而进行的手术会损害你和我们的专业形象。无恰当指证的手术不仅仅是不合伦理的，其简直就是人身攻击。

七、不断学习，向领域内的最高水准看齐

We all must aspire to perform the highest quality of orthopaedic surgery that we are capable of doing. Within your chosen niche, you should do everything you can to learn from the best.

我们必须渴望实施我们的能力所能达到的最高质量的骨科手术。在你所选择的领域里，你需要倾尽全力向业界的最好看齐。

Read publications and texts. Attend courses. As we interpret medical data, large multicenter studies report the standard level of care that is present as an average across centers. Pay attention to the results of experienced and knowledgeable single surgeon series. The large single surgeon series can represent the level of results that can beobtained with dedication to that subject.

阅读刊物和课本。参加培训课程。就像我们解读医学数据一样，大的多中心研究成果代表了跨中心（普遍）适用的医疗关怀的一般水准。然而，我们需要密切注意那些有着丰富经验和学识的单个医生的系列研究成果，因为单个医生的大系列研究成果能代表全身心致力于该课题（在此研究范围内的）所能获得的（世界最高）水平。

注：

高层次的学习方法：向业界最好学习并着重于学习单个医生的关于某一领域的大的代表世界最高水准的系列研究。代表普遍水准的多中心的研究成果可让我们知道业界的大多数精英都在怎么做、如何做。

中等层次的学习方法：只看课本、书籍来学习处理问题的一般原则和方法。

一般层次的学习方法：无阅读及思考而仅凭带教老师或主任言传身教的学习方法。

八、彻底的学习和运用现有的最好的技术

Visit and observe patient care and surgery with the field’s best. Most orthopaedic surgeons are open to this. A corollary to this is: learn and adopt the best existing techniques completely before attempting to modify them or develop new ones. By doing this, the maximum benefit to the patient can be obtained, and in some cases disasters can be avoided.

参加和观察专业领域内最好的病人关怀和手术。大多数骨科医师是非常愿意这样的。对此可以这样推理：在尝试革新技术或者发展新技术之前，需要彻底的学习和运用现有的最好的技术。这样做了，医生就能使得病人最大程度上受益，并且在一些情况下能避免（给病人带来）灾难。

As a resident in 1978, I attended my first Swiss AO Course. On returning home, I was delighted to be presented with a tibial plafond fracture. I operated enthusiastically; however, as the months progressed, I watched in horror as greenbone fell out of the wound. I had learned how to plate and screw the bone, but not how to make the proper incision and handle the soft tissues.

作为一名住院医师，我在1978年参加了我的首次瑞士AO课程。回国后，我为能主刀一例胫骨平台骨折而欣喜若狂。我激情四射得做完手术。然而，数月过后，我惊诧的发现绿色的骨头自切口冒出（感染）。我学会了如何用接骨板和螺钉固定骨折，但没学会如何作切口和处理软组织。

Similarly,successful acetabular fracture surgery is achievable with the specific combinations of the operating table, patient positioning, surgical approach, reduction techniques, and implants.

I have a few visitors who wish only to peer into the open wound. It bears repetition that you should learn and adopt the best existing techniques in their entirety before attempting to modify and develop new ones.This knowledge will keep you from repeating the mistakes of past failed techniques and forms the basis of our technical evolution.

同样的道理，当一些特殊因素，如手术床、病人体位、手术入路、复位技术、内固定物等，有机融合于一体时髋臼骨折手术方能成功。我发现一些参观我手术的医生仅仅想看到手术切口（仅仅看我如何显露骨折而非整个手术过程）。在此有必要重申：在试图改良技术和发展新技术之前，你需要先将现有最好的技术进行整体的学习和运用。这一认识是技术革新的基石并能使你免于重复过去失败技术的谬误。

注：除了认真学习以外，我们也应该虚心和踏实：不要轻易得怀疑知名学者的成果、推翻现有的诊疗常规、“改良”甚至“发明”新的器械及技术。如果经过论证你可以这样做，那么一定需要建立在熟练学习和应用现有最好技术的基础上。否则，常常会重蹈覆辙或失败。上世纪70年代末，Matta教授是带着怀疑的心态到法国向享誉世界的髋臼重建大师Emile Letournel学习的。通过逐渐的学习和认知，他逐渐拜服并把Emile Letournel尊为他人生中最为重要的两位mentor中的一位。他在一次近来的采访中说道他常会把一些新的想法运用于髋臼骨折的手术中而不遵循Emile Letournel所教授的方法，结果到最后发现行不通而还要用EL的方法从新来过（而此时的他早已蜚声世界）。他还说了以下三句话：

“I think we have to learn to live with the fact that very few surgeons can invent something truly novel. Most of us should accept that they need to learn the knowledge that's gone before, and to try to be as good as those who are achieving the excellent results. This may be hard to swallow, but that's how it is.”

“ The protocoland techniques developed by Emile Letournel have the merit of being there, of being efficacious, but also of being the best supported by clinical follow-up and clinical data. Everything proposed by Emile Letournel is supported by very advanced statistics. These results have been confirmed by Jeff, by Keith Mayo,by Eric Johnson, by myself, and by many other surgeons.

Emile Letournel教授已离世20年了，他所创的髋臼骨折的分型标准、手术入路、复位技术等至今仍在应用而未被后辈（包括Keith Mayo、Eric Johnson还有Joel Matta本人）超越

“It would be a shame if the surgery of acetabular fractures were to get overwhelmed by too many unproven novelties. It is one thing to devise a new technique; it is quite another to show that the techniqueis valid, and superior to the techniques currently available.”

九、聪明才智对外科医生更重要

Is everyone created equal as surgeons? Of course not. Surgery is a combination of intellect and motor skills. I would say that intellect is by far the most important factor. The most important factors before surgery are an understanding of the fracture and establishing a good preoperative plan, including setup, approach, reduction, and fixation strategies. Concentrate your plan more on how you will reduce the fracture rather than how you will fix it. Reduction is typically a bigger problem then placing the implant. For a given surgery, one of several implants may be applicable, and your familiarity with a device may be the reason to use it.

每一个外科医生生来就平等吗（能拥有等同的学识和成就吗）？当然不！外科手术是聪明才智和充沛体力的结合体。目前来看，我完全认为聪明才智是最为重要的因素。而手术前最为重要的因素包括对骨折的透彻理解和建立起来的包括组织实施、入路、复位和固定策略在内的术前计划。该术前计划需要更多的侧重于怎么对骨折进行复位而非固定。复位是典型的大难题，放置内固定物次之。针对一个特定的手术来说，（遵从原则的基础上）可能有多种内固定物可以选择，而你可以根据自己的熟练度来选择其中一种。

十、学会应对手术中的糟糕情况

I think that surgeons are best judged not by a surgery in which everything goes well, but by how they react when things start to go wrong. I have witnessed ‘flails’ triggered by panic with the situation going from bad to worse. The high stress of a problem situation should ideally trigger your mind to a higher level of focus to deal effectively with the unexpected problem. Experience and contingent strategies can help in these situations.

我认为，最优的评价医生的方式不是（他们所做的）一切都顺利的手术，而是当手术中某些环节变得糟糕时他们是如何应对的。我曾经亲眼目睹过在情况由不好变得更糟糕时因恐慌而颤抖得就像挥舞连枷一样的手臂。面临问题时的高度紧张状态，理论上可以激发你的精神达到更高程度的集中以有效地处理突发的难题。这种情况下，丰富的经验和灵活的策略可发挥作用。

十一、自我批判精神

We need to critically assess the result of the surgeries that we perform. I would say that a minority of my surgeries is performed completely to my satisfaction, particularly acetabular fractures. Postoperative x-rays always should be a stimulus for thoughts regarding how things could have been done a little better.

我们需要批判性的评估我们所做手术的效果。我敢说，只有少数我所做过的手术能完全使我满意（多数都有瑕疵和遗憾），特别是髋臼骨折。我认为，术后X线片总是应该被视作让我们有“术中如何能做得再好一点”这样思索的刺激物。

注：Matta教授这种时刻自我批判的品质，或许，是他能有如此大成就的秘诀。他的髋臼骨折手术的优良率在85%，比他的老师Emile Letournel提高了10%。

采访原文：“In my series,I have had a 15 percent incidence of poor results. This includes, of course,the 3 per cent infections. There were, of course, patients who had lesions that could not possibly be treated, but also patients whom I should not have operated.”

十二、手术速度也是关键

How critical is speed when performing surgery?At the beginning of my career, I did not consider speed to be important; now I think it is, although admittedly not the most consequential factor. I think speed is a benefit in limiting tissue trauma and infection. It also is an economic factor for you and the hospital as well as one that limits the number of patients you can benefit.

在我们做手术时，速度有多关键？在我职业生涯的早期，我并不认为速度重要。而现在，我认识到了它的重要性，尽管它被公认不是最为重要的因素。我想，速度有利于限制软组织损伤和感染。速度对你和你的医院来说是一个经济指标，并且也是限制你所能造福的病人数目的指标。

During my early years of operating on acetabular fractures, I was assisted for the first time by my chief, Gus Sarmiento, on a Kocher-Langenbeck approach to a transverse plus posterior wall fracture. If you know Gus Sarmiento, you know that he is not a particularly patient person. Gus’first words at the scrub sink were, ‘Joel, how long is this going to take?’My response, ‘Gus, relax and get ready for a 4-hour case.’ His response,‘Four hours, I’ll give you 2!’ The case took 2 hours and the result was asgood as my 4-hour cases; from that time forward, similar cases took approximately 2 hours.

在我早年的主刀的髋臼骨折手术中，其中一例髋臼横形加后壁骨折的手术是经Locher-Langenbeck入路且第一次由我的主任(Gus Sarmiento)作为我的助手而完成的。假如你了解Gus Sarmiento，你会知道他不是一个特别有耐心的人。Gus在洗手池旁对我说的第一句话就是“Joel，这台手术需要多长时间？”我回答：“Gus，放松点，准备好做一台四小时的手术吧！”而他的回应却是“四小时？！我只给你两个小时！”结果，这台本来准备做四个小时的手术仅仅用了两个小时而且结果却一样得好。从那时起，类似的手术均耗时两小时左右。

Conversely, you should take whatever time is necessary to achieve the desired result. Speed is not a primary goal but should increase progressively with your years of experience. Watching a good surgery go quickly means that you will not see particularly fast movements, but rather well planned and effective ones.

于此相反，为了达到你所渴望的效果，你需要用足所必需的时间。这就是说，速度虽然不是首要目标，但是它应该随着你逐年的经验而逐渐加快。然而，当你看到一个手术由好变快时，这将意味着你看到的操作动作与其说是格外的快，还不如说是计划得好和施展得有效。

十三、成为一个称职的领导者

As an orthopaedic surgeon, you are the organizer and leader of the operating room team. You assume this role, regardless of whether you are inherently organized or an obvious leader type. I don’t think that personal charisma or forcefulness is a prerequisite for leading an effective operating room team. The factors that I consider most important are planning, respect, education, and encouragement for your team members and working with your team in a hands-on way.The concern that you show for the patient and the commitment that you show to achieve an excellent surgical result will rub off. By all means, don’t be the one who is responsiblefor delays, or your tardiness and lack of efficiency also will rub off. Leading the teamto improve performance and efficiency is a job that never stops.

作为一个骨科医生，你是手术室小组的组织者和领导者。你将自己假定为这样的角色，不管你是什么类型的性格。我并不认为个人的魅力或强健体魄是领导一个高效手术组的先决条件。相反，我所认为的最为重要的因素是对组员的规划、尊重、教诲和激励以及亲力亲为地与他们协作。与之相比，你所表现出的对病人的关怀和对优异手术效果的承诺将变得黯然失色。尽一切所能，不要使自己成为一个行事拖沓的人，则你的迟缓和效率低下也将不复存在。领导自己的小组以改善工作表现和提高工作效率是一项永远不能停歇的事业。

十四、正确地面对并发症

Surgical complications are inevitable, and the indication for any surgery must be judged relative to their potential incidence. When a complication occurs, an honest discussion with the patient at an early time is essential. There is a tendency to feel guilty and to avoid the inevitable discussion with the patient and family. It is important to use the word ‘complication’ and confront the situation openly and directly. The patient will at least take comfort that you are no less involved in their care and will do everything possible to ensure a positive outcome.

手术并发症是不可避免的，任何手术的适应症（指手术的执行与否）都必须通过该手术相关并发症的发生率进行评判。当并发症出现时，医生有必要尽早与病人进行一次诚恳的商讨。通常，医生会有愧疚感进而倾向于免却与病人及其家属进行此必要讨论。（然而，面对此情此境，我认为）有两件事显得（格外）重要：一是直接地开诚布公地面对（即与病人沟通），二是一定要用“并发症”这个词语（来告知病人）。（因为，这样做了）病人至少会因为了解到你不仅仅参与了他们的诊疗而且还将尽一切所能来保证他们能有好的预后而感到宽慰。

Surgical wound complications, such as hematoma and infection, are some of the most difficult to face and potentially harmful to the patient. Three orthopaedic surgeons can look at a wound regarding infection and say no, maybe, or yes. It is easier to pronounce a colleague’s wound infected than your own. Saying ‘infection is present’ to you, the patient, and also writing it in the chart clears the way for providing effective treatment.

手术切口相关并发症，诸如血肿和感染，是我们所面临的会给病人带来潜在的危害的诸多难题中的一部分。三个骨科医生查验过切口后方可能会做出是否感染的诊断。通常，相对于我们自己的病人而言，我们能更轻易地说出某个同事的病人出现了感染并发症。直接告知（自己的）病人“你感染了”并且如实记录在病历中，这样做会为病人提供有效的治疗扫清道路。

十五、保持诚恳和谦逊的态度

The public often believes the myth that miracles in medicine are the norm. The truth is that we treat most problems with significant limitations with respect to our understanding and knowledge, and it is likely that we will retrospectively view many of our current treatments as primitive. Getting good results after orthopaedic trauma entails great difficulties. We,therefore, need to practice with honesty and humility.

大众总是相信医界存在奇迹这样的神话。而事实上，我们处理多数疑难杂症时面临着理解力和学识方面的显著限制；而且，等到将来我们回过头来审视我们目前治疗时，我们很可能会认为它们很原始。追求骨科创伤后良好预后这件事本身饱含艰辛。因此，我们需要带着诚恳和谦逊的态度投身于临床实践。

十六、系统管理病例

I believe that a simple documentation system,including diagnosis, treatment, complications, and results, is a big help in quality control. Simple data forms that can be coded in a prospective manner and entered into a computer database may not add a great deal of time and expense to your practice. This information can guide the evolution of yourpractice methods. It is important to have results to compare to improve ourresults. Changes to improve results are best used for groups of patients or fractures with a high level of poor results and/or complications.

我相信，对质量控制来说，一个包括诊断、治疗、并发症和预后在内的简单的文案记录系统会有很大帮助。（而且我认为，）对于你的临床实践来说，一些可以前瞻性方式编辑并能输入电脑数据库的简单表格不会额外耗费多少时间和经费。这些文案信息能引导你的临床科研方法的革新。通过临床效果的比较以提高疗效，这样做很重要。由之而来的治疗方法上的变化最适用于那些有着较差疗效和较严重并发症的病例或骨折。

注：世上没有太多捷径可循。为了达到目的地，你在行程中所做的一些小小的看似额外的实则相关的事情很可能会加快你的行程。正如这些小小的表格和病例资料记录，可能是你在临床实践中实现卓业的助燃剂。用通行的诊断分型、疗效评分、有效随访的机制将所做诊疗编码，做到易于提取，类比分析。我想，这样做了，不管能不能成名，一定能成功。我推荐骨盆髋臼领域的医生熟练掌握OTA分型。

十七、保持健康体格和生活方式

I like to give credit to my mentors. In my own career, my most important mentors have been Augusto Gus Sarmiento and Emile Letournel. I take pride in my own contributions to orthopaedic knowledge, butrecognize that a huge basis of my practice is what I have learned from others.

我由衷地钦佩我的良师益友。在我的职业生涯中，我最为重要的师友是Augusto Gus Sarmiento和Emile Letournel。我对我对骨科学术领域所做的贡献感到自豪，但我清楚地知道我（卓越）临床实践的巨大基石乃为我自他人所学。

I consider health and lifestyle to be important in my performance as an orthopaedic surgeon. Some restraint with food and alcohol, as well as exercise, benefits you and your patients. I think a mistake that most of us make is not taking enough time off. I once asked Harald Tscherne how much vacation he took. He answered, ‘Six weeks.’ I said that must include your educational travel. ‘No,’ he said, ‘six weeks vacation.’ None of us would question Prof. Tscherne’s commitment or productivity.

我认为，在我作为骨科医生的临床工作中，健康体格和生活方式很重要。有节制的饮食、酒精和锻炼会施惠于你和你的病人。我想，我们中大多数人所犯的错误就是没有花足够的时间来休养身心。我曾经问Harald Tscherne他一年休多长假期。他说六周。然后，我说那肯定包括他的教育（指参会授课等）旅行。“不”，他说：“纯粹的六周时间。”事实上，没有任何人会质疑Tscherne教授的贡献和成果。

You have carefully selected your career and have passed an extensive training and selection process to become an orthopaedic trauma surgeon. The evolution of your practice toward improved clinical results will make it all the more exciting and rewarding.

你已慎重的选择了你的职业并已然经历了深入的培训和严格的筛选程序而成为一名创伤骨科医师。通过不懈的努力，你的提高了临床效果的临床实践革新将变得愈加激动人心和富于回报。

在Github Pages上托管Reveal.js

发表于 2018-08-16 更新于 2018-10-29 分类于 Web开发

一、在Github Pages上托管Reveal.js

（一）创建一个新的respository

在GitHub上创建一个新的respository，比如取名为PPT，然后在本地（比如Documents）打开git bash，clone这个respository到本地，输入

git clone https://github.com/user/PPT.git
		
#user为你的github用户名
#git clone表示从远程主机克隆一个版本库

（二）创建gh-pages branch

在终端中打开刚才创建的本地文件夹Documents，输入

cd Documents/Blog/PPT
git checkout --orphan gh-pages
	
#创建orphan分支，命名为gh-pages
#如果不提交内容，这个分支实际上没有创建

（三）上传reveal.js到branch

将reveal.js文件下载下来，全部拷贝到本地Documents中的PPT文件夹，并在reveal.js文件夹中编辑好幻灯片，输入

git add .
git commit -m "1st commit"
git push origin gh-pages
	
#git add . 监控工作区的状态树(即文件夹或目录)，使用它会把工作时的所有变化提交到暂存区，包括文件内容修改(modified)以及新文件(new)，但不包括被删除的文件。
#git commit 主要是将暂存区里的改动给提交到本地的版本库
#git commit -m表示可以直接输入后面的提示内容，如“1st commit”
#git push origin gh-pages表示把本地代码（origin）提交到gh-pages分支

接下来，输入Github账户的用户名和密码即可。可以试着访问：https://lysp2017.github.io/PPT/幻灯名.html，就可以看到幻灯片了。

二、在Hexo博客中部署Reveal.js

在Markdown中输入幻灯片的地址即可

1	[https://lysp2017.github.io/PPT/幻灯名.html](https://lysp2017.github.io/PPT/战火炼成的生命之星.html)

在GitHub上创建一个新仓库

发表于 2018-08-16 更新于 2019-02-28 分类于版本控制系统

在任意的页面右上角点击 +，然后点击新建仓库 New repository。
为你的仓库创建一个简短便于记忆的名字。例如 “PPT”。
为你的仓库添加一个描述（非必须的）。

例如 “My first repository on GitHub”。
选择你的仓库类型为公有或者私有：
- Public：公有仓库对于一个刚入门的新手来说是一个不错的选择。这些仓库在 GitHub上对于每个人是可见，你可以从协作型社区中受益。
- Private：私有仓库需要更多的步骤。它们只对于你来说是可用的，这个仓库的所有者属于你和你所指定要分享的合作者。私有仓库仅对付费账户可用。
选择Initialize this repository with a README。
点击Create repository。

避免外科常见错误：伤口（一）（未完）

发表于 2018-08-16 更新于 2018-10-29 分类于临床实践

说明：
1. 部分参考LWW出版的Avoiding Common Surgical Errors

贝叶斯定理（Bayes's theorem）及贝叶斯推断(Bayesian inference)

发表于 2018-08-10 更新于 2019-02-28 分类于统计学

说明
1. 参考自阮一峰博客中的文章：贝叶斯推断及其互联网应用（一）

一、条件概率（Conditional probability）

条件概率，就是指在事件A发生的情况下，事件B发生的概率，用$P(B\mid{A})$来表示。
根据文氏图，可以很清楚地看到在事件A发生的情况下，事件B发生的概率就是$P(A\bigcap{B})$除以$P(A)$。 \[P(B\mid{A})=\cfrac{P(A\bigcap{B})}{P(A)}\] 因此：\[P({A} \bigcap {B})=P(B\mid{A})\times P(A)\] 同理可得：\[P({A} \bigcap {B})=P(A\mid{B})\times P(B)\] 所以：\[P(B\mid{A})\times P(A)= P(A\mid{B})\times P(B)\] 即：\[P(A\mid{B})= \cfrac{P(B\mid{A})\times P(A)}{P(B)} \]

二、全概率公式

假定样本空间S，是两个事件A与A'的和。

上图中，红色部分是事件A，绿色部分是事件A'，它们共同构成了样本空间S。

在这种情况下，事件B可以划分成两个部分。

即：\[P(B) = P({B} \bigcap {A}) + P({B} \bigcap {A'})\]

在之前的推导当中，我们已知：\[P({A} \bigcap {B})=P(B\mid{A})\times P(A)\] 所以：\[P(B) = P(B\mid{A})\times P(A) + P(B\mid{A'})\times P(A')\] 把 $P(B)$代入上一节中的条件概率公式 $P(A)= $ \[P(A\mid{B})= \cfrac{P(B\mid{A})\times P(A)}{P(B\mid{A})\times P(A) + P(B\mid{A'})\times P(A')} \]

三、贝叶斯定理及贝叶斯推断

对条件概率公式进行变形，可以得到如下形式： \[P(A\mid{B})= \cfrac{P(B\mid{A})}{P(B)} \times P(A)\]

$P(A)$称为"先验概率"（Prior Probability），即在B事件发生之前，我们对A事件概率的一个判断。
$P(A\mid{B})$称为"后验概率"（Posterior Probability），即在B事件发生之后，我们对A事件概率的重新评估。
$\cfrac{P(B\mid{A})}{P(B)}$称为"可能性函数"（likelihood），这是一个调整因子，使得预估概率更接近真实概率。

所以，条件概率可以理解成： 后验概率　＝　先验概率 × 调整因子

这就是贝叶斯推断的含义。我们先预估一个"先验概率"，然后加入实验结果，看这个实验到底是增强还是削弱了"先验概率"，由此得到更接近事实的"后验概率"。

在这里，如果"可能性函数"$\cfrac{P(B\mid{A})}{P(B)}$>1，意味着"先验概率"被增强，事件A的发生的可能性变大；
如果"可能性函数"$\cfrac{P(B\mid{A})}{P(B)}$=1，意味着B事件无助于判断事件A的可能性；
如果"可能性函数"$\cfrac{P(B\mid{A})}{P(B)}$<1，意味着"先验概率"被削弱，事件A的可能性变小。

四、水果糖的例子

问题：两个一模一样的碗，一号碗有30颗水果糖和10颗巧克力糖，二号碗有水果糖和巧克力糖各20颗。现在随机选择一个碗，从中摸出一颗糖，发现是水果糖。请问这颗水果糖来自一号碗的概率有多大？

我们假定，H1表示一号碗，H2表示二号碗。由于这两个碗是一样的，所以$P(H_1)$ = $P(H_2)$，也就是说，在取出水果糖之前，这两个碗被选中的概率相同。因此，$P(H_1)$ = 0.5，我们把这个概率就叫做"先验概率"，即没有做实验之前，来自一号碗的概率是0.5。

再假定，E表示水果糖，所以问题就变成了在已知E的情况下，来自一号碗的概率有多大，即求$P(H_1\mid{E})$。我们把这个概率叫做"后验概率"，即在E事件发生之后，对P(H1)的修正。

根据条件概率公式，得到 \[P(H_1\mid{E}) = P(H_1) \times \cfrac{P(E\mid{H_1})}{P(E)}\]

已知，$P(H_1)$ = 0.5，$P(E\mid{H_1})$为一号碗中取出水果糖的概率，等于0.75，那么求出$P(E)$就可以得到答案。

根据全概率公式： \[P(E)=P(E\mid{H_1}) \times P(H_1) +P(E\mid{H_2}) \times P(H_2)\]

所以： \[P(E)=0.75\times0.5+0.5\times0.5=0.625\]

五、假阳性问题

已知某种疾病的发病率是0.001，即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病，它的准确率是0.99，即在患者确实得病的情况下，它有99%的可能呈现阳性（灵敏度为99%）。它的误报率是5%，即在患者没有得病的情况下，它有5%的可能呈现阳性（特异度为95%）。现有一个病人的检验结果为阳性，请问他确实得病的可能性有多大？

假定A事件表示得病，那么$P(A)$为0.001。这就是"先验概率"，即没有做试验之前，我们预计的发病率。

再假定B事件表示阳性，那么要计算的就是$P(A\mid{B})$。这就是"后验概率"，即做了试验以后，对发病率的估计。

\[P(A\mid{B})= \cfrac{P(B\mid{A})}{P(B\mid{A})\times P(A) + P(B\mid{\overline {A}})\times P(\overline {A})} \times P(A)\]

\[\approx \cfrac{0.99}{0.99 \times 0.001+0.05\times 0.999} \times {0.001} \]

我们得到了一个惊人的结果，$P(A\mid{B})$约等于0.019。也就是说，即使检验呈现阳性，病人得病的概率，也只是从0.1%增加到了2%左右。这就是所谓的"假阳性"，即阳性结果完全不足以说明病人得病。

为什么会这样？为什么这种检验的准确率高达99%，但是可信度却不到2%？

首先是与误报率(5%)太高有关，其次也和发病率太低(0.1%)有关。

伦敦和大不列颠救护车的历史：从1860年到现代(未完)

发表于 2018-08-08 更新于 2018-10-29 分类于人物与历史

说明：
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research
???

一、摘要

在21世纪，我们对于能够快速反应的救护车服务习以为常。救护车能够可靠地将重病员和伤者送到医院，同时伤病员在途中也可以获得熟练的复苏和医疗护理。然而在19世纪，并没有这样的服务，人们只能自己通过各种方式将伤病员送到医院。本文简要概述了伦敦救护车服务的形成历史，并描述了伦敦以外救护车服务的发展历史。

本文描绘了一段时期中英国人生活的图景，正因为政府在大多数医疗保健领域的自由放任的态度逐渐形成了今天的国民健康服务（National Health Service,NHS）。历史揭示了每个时期政治气候的思维方式。

临床研究基本概念：随机对照试验（三）

发表于 2018-08-02 更新于 2019-02-28 分类于临床研究

说明：
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

随机试验中的分配隐藏：对抗破译(defending against deciphering)

一、摘要

恰当的随机化有赖于充分的分配隐藏。分配隐藏程序使得临床医师和受试者不知道下一例的分组情况。没有它，即使已经生成了恰当的随机分配序列也可以被推翻。
随机对照试验至关重要的无偏倚性质常与实施分配隐藏的过程中遇到的麻烦产生冲突。
恰当执行分配隐藏给研究实施者增添麻烦，这会让临床医师感到不高兴。随机对照试验对临床医师而言是一个诅咒。许多参与试验的人会试图破译分组的序列，这一行为违反了随机化。
对于一些实施试验者而言，破译分配序列经常成为一项无法抗拒的智力挑战。无论他们的动机是单纯的或恶意的，这种意图都损害了试验的有效性。
事实上，不充分的分配隐藏通常会导致高于预计的治疗效果，但偏倚在两个方向上均可出现。
试验研究者会竭尽所能地努力破译分配序列，因而试验设计者必须在设计试验时也努力聪明地防止破译发生。
研究者们必须恰当运用分配隐藏以有效地避免选择和混杂偏倚。
此外，研究者应报告有关重要预后变量的基线比较。
然而基线特征的假设检验是多余的，并且，如果其导致研究者回避报告任何的基线不平衡则可能是有害的。
医学研究会认为关于使用链霉素治疗肺结核的对照试验是里程碑的原因，并不像通常所认为的那样只是由于应用了产生分配顺序的随机数字表，更是因为其清晰地讲述了用来向所有参与入选病人的人员隐藏分组顺序的防范方案。

二、前言

生成一个不可预测的随机分配序列是随机对照试验中第一个最重要的随机化要素。实施这个序列，至少要到患者被分配至各自的组之前保持其隐藏即分配隐藏(allocation concealment)是第二个最重要的元素，如果缺乏分配隐藏则试验中的随机化就会崩溃。

作为随机化的一个直接结果，许多随机对照试验的报告中的第一个表格描述了各个比较组之间的基线特征。研究者们应该描述他们进行试验的人群并提供各组之间的基线资料的对照以使得读者评价其可比性。本章我们着重阐述恰当进行分配隐藏和基线特征报告的方法。

三、分配隐藏

研究者对分配隐藏有很多的错误概念。恰当的分配隐藏是严格执行某一随机分配序列而预先不知道分配治疗方案的保障。分配隐藏与实施分配序列的技术有关，而与生成分配序列的技术无关。然而有人在讨论分配隐藏的时候会离题万里地说到拋硬币法(flipping coins)或使用随机数字表(use of random number tables)。这种离题的讨论完全是方法学上的前言不搭后语；分配隐藏和序列生成完全不同。此外，有的研究者会将分配隐藏和隐藏治疗方案混淆起来。

没有充分的分配隐藏，即使随机化了，不可预测的分配序列也会被损坏。按照现有的关于预后的观点，有的患者可能会被分配到被认为不适合的治疗组，如果事先知道下一个分组方案，有的研究者会因此而排除这个患者入组。同样地，预知下一个分组也可以将某些受试者分配至所认为的合适的组，这很简单，通过推迟受试者入选直至下一次合适的分配出现就行了。防止预知如何分配治疗方案可以避免这些偏倚。分配隐藏防止那些招募入组受试者的人知道随后的分组。必须在不知道后续分组的情况下决定纳入或拒绝一个受试者并且获得知情同意书。

（一）分配隐藏的重要性

分配隐藏做得不好的试验倾向于夸大治疗效果。此外，隐藏得最差的试验在结果中产生更大的异质性(即比起做得好的研究，差的研究试验的计算结果明显上下波动）。这些有试验依据的证据证实了不充分的分配隐藏致使试验中出现偏倚。
事实上，缺乏充分的分配隐藏的话，不管有没有一个随机(不可预测)序列都没什么不同了。假定研究者们用随机数字表生成一个合适的分配序列，但是，之后他们将这个序列贴在一个告示板上，于是任何一个参加此试验的人都能看到随后的分组。类似的事情还有通过将方法指导卡片(method indicator cards)放在一个半透明的信封中来实施分配顺序。拿着这个信封对着亮着的灯，这个不充分的分配隐藏程序就很简单地被破译了。有了告示板和信封，负责纳入受试者的人可以察觉到随后的治疗分组，随即将有较好的预后的人分至试验组，而预后较差的人分至对照组，反之亦然。即使有了合适的随机序列，试验中也易出现偏倚。
研究者因此应确保在随机设计中有合适的序列生成和充分的分配隐藏。这两方面的任意一个错误都将损害随机化，导致不正确的结果。例如，某试验的结果显示一种治疗的效果更好，然而这其实仅仅反映了分配过程的偏倚；或者试验显示无效而实际上治疗效果是有害的。此外，这种试验的结果可以比一个明晰的观察研究所得出的类似结果更有毁坏性。人们常假定并能意识到观察性试验中有偏倚，统计分析和最终阐述时会对此加以考虑。相反地，贴着随机化标签的研究经常被认为是没有偏倚的，而不充分的报告通常会掩盖它们的不足。
随机对照试验的可信度(credibility)为临床和预防管理中更快更大程度的改变提供支持。如果不是基于最好的研究，结果则会是浪费有限的健康资源，甚至更糟的是会损害人们的健康。因此，随机对照试验的(well-deserved)的可信度产生了间接的责任。不恰当的随机试验很容易造成错误判断。

（二）破译的各种情况

有试验依据的研究发现提示研究者有时候会破坏随机化，尽管他们几乎不记录这些颠覆。无论如何，当研究者不记名地在流行病学研讨会上回应质疑的时候，常常涉及分配设计被破坏的例子。
此类例子的不同个案描述了从简单到复杂的操作范围。大部分分配隐藏设计被研究者破译是因为其方法不够充分。例如：
- 或是贴在告示板上。
- 或是拿着半透明信封对着灯光可见而解码随后的分组，然后，研究者们就可以改变入组或将受试者分配至特殊的研究组。
- 有的则是打开未封口的分组信封，感觉信封的不同重量或者简单地打开未编号的信封直至他们找到某种想要的治疗方案。
研究者们破译一个较好的分配隐藏设计则比较困难。然而，实际上总会有人描述其最终智取(破译)了某个方案。
- 比如，某些医生依次拿着编号的、不透明的、封口的信封在放射科对着热灯(一种非常明亮的白炽灯泡）以试图破译分组。
- 在使用中心随机化的研究中，试验研究者通过电话向中心一次性索要其后几个人的分组，他们至少在一两种情况下能得到分组顺序。
- 在用依序编号的药物容器的试验中，有人依靠容器标签的外表来破译分组。
- 有人在半夜看见某个主治医师为了寻找分配列表搜遍了办公室里的主要研究者的文件，于是她放弃了通过容器的外包装解码的方法。她首先想到的是：这个主治医师可真聪明！鉴于她在方法学上的天真和无知，她没有意识到这种行为会导致试验的偏倚。
尽管研究者理论上明白研究需要无偏倚，可一旦他们加入某试验有时会无法保持无偏倚。研究者可能希望某些病人从某种治疗中获益，或试验结果能证实他们的想法。恰当完成的随机对照试验的程序会阻止这种临床倾向性，因而致使研究者进行试验时感到困扰。
有的科学家的目的是蓄意破坏他们的结果。然而，许多破译随机序列的意图直接表现出缺乏对这一行为科学后果的认知。此外，对于有的人，破译分配设计可能常常是一个无法抗拒的巨大的智力挑战。如Oscar Wilde所写，“消除诱惑的唯一方法是向其屈服”。然而无论他的动机纯洁与否，这种意图损害了试验的有效性(validity)。
研究者必须认识到人性中的好奇心，设立方法学的安全防范，恰当的分配隐藏无形中会阻止对随机化的破坏，在实际中使试验避免选择和混杂偏倚。
设计恰当的分配方案要花时间、精力和思考。在全面地检查最后方案前，研究者不应该开始委派任务。研究实施者会竭尽所能地破译分配序列，所以试验设计者必须在设计试验时也努力聪明地防止破译发生。

（三）用分配隐藏寻找什么？

研究者认为按下列方法进行分配隐藏是充分的：
- 顺序编号(sequentially numbered)
- 不透明(opaque)
- 封口的信封(sealed envelopes,SNOSE)
- 药房控制
- 编号或编码药物容器
- 中心随机法(例如电话告知研究办公室)
- 或其他描述分配隐藏：如一个可靠的计算机辅助方法。
这些标准建立了最简单的方法学标准，但仅约1/4的试验符合标准。通过从已发表的报告中评估分配隐藏，读者会很容易明白如何合理达成这些标准(Panel 1)。不过毫无疑问，那些最简标准是能被超越的，如果研究者提供的描述不仅结合了最简标准且有其他更严格标准的元素，读者更能相信试验已经防止了选择和混杂偏倚(Panel 2)。
信封分配隐藏方法较其他的方法更易怀疑被人巧妙地操纵，因而并不理想。如果研究者使用信封法，他们应严谨地设计并监察(monitor)分配过程以确保序列隐藏。除了使用顺序编号、不透明、封口的信封外，他们应确保事先给信封编号，且只有在相应的信封上写上受试者姓名和其他细节信息之后才能按编号顺序打开之。我们也推荐在信封内面使用压力复写纸或碳纸，以便上述信息能留在分配表上，从而建立一个有价值的印迹用于稽查。在信封里放硬纸板或铝箔可以进一步避免通过热光源探知分组。
药房环节也可以造成分配隐藏和序列生成的困难。尽管提到由药房进行分组的报告通常已经被归入“此试验已经使用了一种可接受的分配隐藏机制”的范围内，但药剂师在试验中恰当地应用随机法的依从性如何并不清楚。
- 研究者应该报告所采用的预防措施。我们知道药剂师违反分组时间表的例子。
- 比如：一个大药房每随机分组一个受试者可以获得150美元。在试验期间，某一周末之后，这家药房用完了两种比较药物中的一种，因此将所有新入组的受试者都分配至另一个药物组，以避免减慢入组速度。而另一家药房则用交替分组来随机化患者。研究者不应该假定药剂师和其他试验实施者都了解随机对照试验的原理，研究者必须确保他们的研究搭档坚持执行恰当的试验程序。在最简标准外，如果研究者说明他们知道或核查药房的分配机制，读者能对其结果更有信心。
使用连续编号容器可防止预测治疗分组，但是这只有在研究者采用了适当防范下才成立。除最简标准外，报告的作者们还应该说明防范措施的进一步细节，确保所有的容器是防止拆封篡改的、等重的、外观相似的，并且建立某些稽查轨迹(如在空瓶或者容器上写受试者的姓名)，这些可以帮助读者评估是否随机化已经被成功隐藏。同样地，尽管中心随机化是一种优秀的分配隐藏方法，仍需建立并执行有效的试验方法。研究者们至少应该说明联络的方法(如：电话、传真、电邮)，保证在随机化之前入组受试者的严格程序，且全面地训练中心随机办公室中的每个人，所有的细节在做试验和写试验报告时都要被考虑到。
其他的方法也可能满足足够的分配隐藏。读者应该寻找描述中关于隐藏的可信成分。如：可靠的计算机辅助方法可以通过保护分组信息直到保证和确认入组而做到分配隐藏。确实，自动分组系统可能会变得更常见。但是，一个仅贮存或单纯地保护分组信息的简单的电脑系统，会变得透明得如同把随机化表贴在公告板上一样。在描述一个分配隐藏方法时，研究者应展示分配隐藏背后的原理及它们是如何达到标准的。
研究者在报告中经常未能对分配隐藏进行哪怕是最少的描述，致使读者不能评估随机对照试验。幸运的是，自从更多的医学杂志开始采用随机对照试验的报告标准，情况开始在改善。此外，由于发表研究报告的促进作用，更多的研究者将能够设计和实施更好的试验。
Panel 1（描述分配隐藏）：
- “……将药物分配和编码的数字结合起来。每10个数字的区组从一个中心办公室被寄至每个中心随机化负责人。这个人(药剂师或护士，不参加受试者诊疗且与此中心的研究者无关)负责分配和准备，并负责试验输液。试验输液在另外一个不同的中心准备好，每24小时送给床旁护士，护士按合适的速率给患者输液。因而随机化顺序对所有的护理工作人员、病房医生和其他试验者都隐藏。”
- “……隐藏于顺序编码的、密封的、不透明的信封中，并且由两个中心的医院药剂师保管。”
- “治疗方案由中心证实入选标准正确性后电话分配……”
- “由Glenfield医院药剂科进行随机化，分配研究药物并持有试验码，这些都会在研究结束后揭盲。”
- “不同的安慰剂和治疗区组由一个药品号标识(medication number)，然后按某一顺序分发给患者。此随机名单准备了两份，一份由包装部门使用……提供泡罩包装(blister packs)的20粒胶囊供10天的早晚服用。这些泡罩分装放在有标签的盒子里。例如：每个患者的每剂量药物放在一个盒子里。
  
  泡罩包装：又称铝塑包装或水泡眼包装，常用的药物包装方法之一
- “个体由计算机产生的名单随机化，集中保存，没有哪个中心知道任何患者分配的治疗方案。每个患者被分发有标志的容器和一个额外的容器盒，以供中心医生需要开处方增至15mg或20mg的西布曲明或安慰剂时使用。”

Panel 2(最简及拓展标准：充分的分配隐藏设计)

关于充分的分配隐藏设计的最简描述	附加描述提供更好的保证分配隐藏的措施
顺序编号，不透明，密封的信封(SNOSE)	（1）将受试者的详细信息写在信封上之后才可以依次打开信封；（2）信封内面的压力敏感复写纸或碳纸可以将信息转录到分配卡上(形成监察痕迹)；（3）信封内放硬纸板或铝箔使得信封在强光下不透明 (不透视）
顺序编号的容器	所有的容器都是防止拆封篡改、等重、外观相似的
药房控制	(1)文章中表明是由研究者设立、验证或者至少是批准的给药房的一个恰当的随机化方案； (2)文章中表明研究者指导药房进行恰当的分配隐藏
中心随机化	联系方法(如：电话、传真、电子邮件)，严格的程序确保在随机化前入组，以及对中心随机化办公室的每个人全面培训

四、基线比较(Baseline comparisons)

（一）基线特征表格

尽管随机化避免了系统偏倚，但这不一定就会产生在预后因素方面完美平衡的分组。干预组间仍留有机遇所致的差异(如：机遇分配不均)。不过统计检验可以解释机遇差异。随机化的过程是显著性检验的基础，并且无论预后因素是已知或未知的，随机化的过程都和预后因素无关。
无论如何，研究者应该在一个表格中按照治疗组别展示基线特征。这些信息描述进行试验所在的假设人群，且让读者看到外推至其他人群的可能性。此外，它让医师将结论推论至特定的患者。

基线特征表格也让读者们比较试验各组在基线时重要的人口学和临床特征。然而，我们通常会不适当的使用假设检验(如表中的P)去比较我们所关注的特征。这些检验测定观察到的差异可能是因机遇产生的可能性。但是，在恰当的随机试验中观察到的差异按定义来说都是因机遇产生的。如Altman所言，“这个程序明显是多余的”。

特征	抗生素组(n=116)	安慰剂组(n=129)
年龄(mean [SD]) (years)	30.2 (5.2)	31.1 (5.9)
体重(median [25th,75th centiles]) (kg)	141 (122, 181)	144 (123, 188)
未产妇(number, %)	62 (53%)	63 (49%)
既往盆腔炎(number, %)	24 (21%)	28 (22%)

对基线特征的假设检验不仅是不必要的，可能还是有害的。
- 研究者用假设检验比较基线特征，报告的显著结果比预计由机遇产生的差异要少。
- 关于这种差别的合理解释是：有的研究者可能决定不报告显著的差异，因为他们相信隐瞒了这个信息，能够增加他们报告的可信度。
- 假设检验间接导致研究者们隐瞒基线不平衡，因而其除了是多余的，也是有害的。

（二）基线特征关注什么

研究者应该报告关于重要预后变量的基线比较。读者应该在考虑所测得的变量预后强度和已经产生的机遇不平衡的程度的基础上观察各组的可比性，而不要根据基线的统计学显著性检验考虑组间的可比性。
上面的表格提供了有效的格式来陈述基线特征。
- 对于连续变量，如年龄、体重，研究者应用一个均值和一种检测变异度(variability)的方法，通常是平均值和标准差来描述。
- 如果数据分布不对称，用中位值和百分位数范围(即四分位数间距)来描述更好。
- 变异度不应该用标准误和可信区间来表述，因为它们是推断而不是统计描述。
- 数目和比例用于报告分类变量。
在分析中，对于结局的统计检验说明了任何的机遇所致的不平衡。然而控制机遇不平衡，例如恰当地计划并实施试验，也许能产生一个更精确的结果。研究者应该陈述任何校正过的分析，并描述他们如何以及为何校正该协变量。

五、结论

恰当的随机化仍是避免选择和混杂偏倚的唯一方法。
事与愿违地是，随机对照试验重要的无偏倚性质与其在实施中令人厌烦的问题同时存在。
随机对照试验阻止了人们的临床倾向，因此如果有机会破译分配方案，许多参与试验的人会试图破坏随机化。
为了将人们的这种倾向控制到最小，试验者必须非常注重隐藏分配方案。
恰当的随机化与充分的分配隐藏密不可分。

临床研究基本概念：随机对照试验（二）

发表于 2018-08-02 更新于 2019-02-28 分类于临床研究

说明：
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

随机试验中分配序列的生成：是机遇，不是选择(chance, not choice)

应用了随机分配，当我们终于向发表文章冲刺时,再严格的评论家也不能说很可能由于我们的偏好或者愚蠢导致了组间的差异偏倚。

一、摘要

随机对照试验提供了临床研究的金标准。但是，随机化也许是试验中最不容易被理解的部分。
任何不恰当的随机化皆导致选择偏倚和混杂偏倚。研究者应摒弃所有非随机的系统性分配方法。
受试者的分配入组应为一随机化的过程。
简单（非限制性）随机化法，类似重复直接抛硬币，是最基本的序列生成过程。此外，不论其他方法如何复杂精妙，在防止偏倚方面均不优于简单随机法。因而研究者应更多地使用这一方法而不是他们现在所用的方法。读者应期待并接受各组样本大小的不一致性。
一些其他复杂的有限制的随机化程序限制了在干预组间的无法预期的样本量不平衡的可能性。
最常用的限制性序列产生程序是区组随机化。如果应用这一方法，研究者应该随机改变区组的大小并使用较大的区组大小，特别是在非盲法试验中。
其他的限制性程序，如“瓮随机化法”，将简单随机和限制性随机法的好处结合起来，当达到某一平衡时最大限度地保护了不可预测性。
分层随机化的有效性依赖于应用某一种限制性随机化程序以达到分配序列在各层之间的平衡。
产生一个恰当的随机序列表花费的时间和精力很小，但可获得很大的科学精确性和可靠性。
研究者应致力于用恰当的资源来生成恰当的随机试验并清楚地报告他们所用的方法。

二、前言

(一)随机对照试验的历史

20年代，R.A Fisher发展了随机化理论并将其作为试验设计的一个基本原则。这一技术主要用在农业研究中。40年代后期，修订后的随机对照试验成功地应用于保健研究。这很大程度上是因为Austin Bradford Hill爵士在伦敦卫生及热带病医学学校的倡议和发展工作。通过努力他成功地发表了第一个应用随机数分配受试者的试验。此后随机化迅速成为保证无偏倚地比较各组的重要标准。

以前，研究者在设计试验时形式上回避对照试验。但是现在，随机对照试验成为方法学上医学研究的最佳标准(Panel 2)。随机对照试验特有的减少偏倚的能力依赖于研究者能够实施减少偏倚主要技巧：随机化。尽管随机分配参加试验的受试者是对照试验最主要的方面，可遗憾的是，这方面仍然是被理解得最少的。

本章我们讲述随机分配背后的合理性及其有关的实施步骤。随机化首先取决于两个内在相关但彼此独立的步骤，即产生一个不可预测的随机分配序列及隐藏此序列直至分配开始，即为分配隐藏(allocation concealment)。本章我们着重于如何产生这样一个序列。在下一章中，我们介绍分配隐藏。

(二)随机化的益处

在分配治疗方案时消除偏倚

除非研究者审慎地确保他们的试验中包含了在疾病预后方面无偏倚的对比组，否则不同的健康干预措施之间的比较会引起误导。在预防或治疗方案的对照试验中，随机化通过避免选择偏倚和混杂偏倚产生无偏倚的比较组。

这样的话，就避免了有意或无意将某个特别的病人纳入某一组而接受某种干预措施。避免偏倚的要点包括从决定选择可以入组试验的患者，到当患者入选后分配入组均要避免偏倚。当受试者入选后，研究者需要立刻将每个受试者按照与试验相符的特征登记，但不知道具体的分组。减少选择和混杂偏倚是随机化最重要的目的。随机化是小或中等效果研究的最好研究设计。
有利于对研究者、参加者和评估者进行治疗方法的设盲，包括可能使用安慰剂

盲法可在随机分配之后减少偏倚，但如果研究者用一个非随机化方案分配治疗方法，该减少偏倚的策略就会是困难的，甚至是不可能的。
允许用概率论(probability theory)来表示各治疗组之间的结局差异仅仅是由机遇(chance)造成的可能性

三、生成序列要寻找什么？

（一）伪装成随机化的非随机化方法(Non-random methods masquerading as random)

讽刺的是，许多研究者对随机化的印象是绝对非随机化的。他们经常错把随意法(haphazard approaches)和交替指定法(alternate assignment approaches)认为是随机化。有的医学研究者甚至认为与随机化法相反的方法是“准随机化(quasirandom)”，比如根据干预前的检查结果决定是否进入干预组。然而，准随机化如同“准妊娠”，它们都回避了定义。确实，不恰当的随机化导致了无限缺陷的可能。不恰当地执行随机化，会在试验中导致选择偏倚和混杂偏倚。
研究者有时候可能是无意识地用随机化的外衣掩饰其非随机化的方法。他们认为已经用所描述的方法进行随机化了，但是此方法显然是非随机的。依据出生日期、病例记录号、报告日期进行分配的方法，或者交替分配方法不是随机化的，更确切地说是系统性的(systematic occurrences)。
系统性方法在理论和实践方面都不能说成是随机化方法。举例来说，在某一人群中，某一周的某一天一个小孩的出生并不完全是一个机遇事件(a matter of chance)。
此外，系统性方法并不能做到分配隐藏。根据定义，系统分组通常无法做到充分的隐藏，因为其导致招募试验受试者的人在分配入组前预先知道如何进行治疗分组。如果研究者报告应用系统分组法，尤其假如其被伪装成是随机化的，读者应警惕其结果，因为这个错误意味着忽视了随机化过程。作者如能准确地报告其某一项研究为非随机化，并且解释他们如何控制混杂因素，这样的研究发现能让我们更信任。此时研究者们还应该讨论潜在的选择偏倚和信息偏倚，以便读者能考虑到其非随机研究的性质和偏倚从而判断其研究结果。

四、生成一个分组序列的方法

（一）简单(非限制性的）随机化方法/Simple (unrestricted) randomisation

Panel 3初步但简练地描述了简单随机化。类似于公平地重复拋硬币（coin-tossing)，尽管是最基本的分组方法，但它保证了对每个受试者接受的干预分配的不可预知性。不论其有多复杂精妙，没有其他的分组产生法能优于简单随机化法的不可预知性和避免偏倚的效果。
但是，简单随机化方法的不可预测性也可以是一个不利条件。由于仅凭机遇分组，小样本中的简单随机化，即1:1比例分组(one-to-one allocation ratio)可以形成各组之间完全不相同的样本大小。

举例来说，总样本大小为20，简单随机化方法生成的约10%的分组序列会是3:7比率的不平衡比例，甚至更高。
这个难题随着样本大小的增长而减小。概率论确保了从长期来讲，各治疗组的样本大小不会严重的不平衡。对于一个样本量大于200的双臂试验(two-arm trial)，其发生显著不平衡的机遇可以忽略。但是，样本量小于200的试验的期中分析(interim analyses)可能导致组间样本量差别甚大。
拋硬币（coin-tossing)、掷骰子(dice-throwing)以及分发事先洗好的牌是合理的生成简单完全随机序列的方法。所有这些手工抽签的方法理论上带来随机化分组的方案，但是在实践中经常变成非随机化。对随机化概念的曲解破坏了良好的目的。

例如，通过公平地抛硬币将受试者以相等的可能性随机分配到两个干预组，研究者会受到诱惑而改变某次或一系列抛硬币的结果(如:一连串都是正面而无背面出现时)。
许多研究者没有真正理解概率论，他们把随机性理解为非随机。举例来说，一对夫妇有了三个男孩想要一个女孩，他们经常认为他们的第四个孩子当然会是一个女孩，但是实际上他们怀上一个女孩的概率还是50%。
一个同事经常在大学课堂上演示被误解了的随机化。他让班级里一半的学生按照恰当的随机化方法给出分组方案，让另一半学生按照他们个人所理解的随机化方法给出分组方案。使用真正的随机化方法分组的学生经常会长时间的连续执行某一个治疗或者另一种。相反的，按自己判断进行分组的则不会。一个班级又一个班级地显示出他们对随机化的误解。(可参见博文《泊松分布及其应用》)
此外，手工抽签的方法更难于执行并且无法验证。尽管抛硬币、掷色子、抽扑克牌都是可以接受的方法，但由于它们可能对随机性造成损害，执行困难，且缺乏验证试验，所以我们建议研究者避免使用。
不过无论使用哪种方法，研究者的报吿中都应该说明清楚。如果不做这样的阐述，读者应警惕这些研究结果。读者会最相信作者描述的用随机数字表(a table of random numbers)或者电脑随机数产生器分配受试者的序列生成方法，因为它们是可以提供验证试验的不可预测的、可靠的、简单的、可重复的方法。
Panel 3: 简单随机化

以一个随机数字表为基础，几乎有无数的方法可以生成一个简单随机序列。比如，用于两组平均分配的方法，预先决定读表格的方向：上、下、左、右或者对角线。然后选择一个任意的起始点(例如：第一行，第七个数)：

\[56\ 99\ 20\ 20\ 52\ 49\ 05\ 78\ 58\ 50\ 62\ 86\ 52\ 11\ 88\ \]

\[31\ 60\ 26\ 13\ 69\ 74\ 80\ 71\ 48\ 73\ 72\ 18\ 60\ 58\ 20\ \]

研究者可以将奇数和偶数分别等同于干预组A和B，用于平均分配。因此一系列的随机数05,78,58,50,62,86,52,11,88,31等代表分配至干预组A,B,B,B,B,B,B,A,B,A等。也可以选择将00_{49等同于A而50}99等同于B，或者00_{09等同于A而10}19等同于B，忽略所有大于19的数字。无数种选择中的任何一种都提供分组的可能性，研究者要严格遵照预先决定的方案执行。

（二）有限制的随机化方法(Restricted randomisation)

有限制的随机化方法控制了出现非期望的样本不平衡的概率。换句话说，如果研究者希望各治疗组的样本大小相等，应该使用限制随机化。

区组法(Blocking)

最常用的达成平衡随机化(balanced randomisation)的方法是通过随机排列区组法[random permuted blocks (blocking)]。

例如，一个区组大小为6，依次纳入的每6个受试者为一组，通常3个被分配到一个治疗组，另外3个被分配到另一组。但是，分配比率可以是不平均的。例如，每个按照2:1比例分配的大小为6的区组中，其中4个人被分配到一个治疗组，2个被分配到另一治疗组。这种方法可以很容易扩展到两个以上的治疗方案。

双盲（double blind）是指：研究对象和研究者都不了解试验分组情况，而是由研究设计者来安排和控制全部试验。
有了区组法，区组的大小可以在试验的全程中固定或者随机的变化。当然，如果应用区组法的随机化研究不是双盲的，区组的大小应该随机变化以减少负责招募受试者的人员看到分配表的可能。如果区组的样本大小是固定的，特别样本量小时(≤6个受试者)，则区组样本的大小在非双盲研究中能被破译。当分配后的治疗分组能被获知后，从前一次分配可以辨识出一个序列。然后随后的分配就能被精确的预计到，无论分配隐藏的效果如何都引入了选择偏倚。较大的区组(如10或20)比较小的区组(如4或6)有助于保持不可预知性，随机改变区组大小亦然。
进行随机对照试验的研究者经常使用区组法。研究者简单地报告说他们进行区组化了，这会使得读者怀疑。研究者们应该明确地报告如何区组化，分组比例(通常是1:1)，选择的随机方法(如，随机数表或者电脑随机数产生器)，以及区组样本的大小(如果随机改变区组大小的话)。

较小的区组可能会出现以下情况（两组，区组长度为4）：

B A B ? →肯定是A。

A A ? ? →肯定是B B。

这样会带来选择偏倚。如何避免这种情况呢？

可以设计为随机长度的区组，如区组长度依次为4、6、6、8、6、4、8、8、4……
随机排列区组法如何实施：以区组长度4为例
- 一个区组内的4个研究对象可以有6种排列方式：
  - AABB
  - ABAB
  - ABBA
  - BAAB
  - BABA
  - BBAA
- 确定好所有的排列形式后，接下来需要将6个区组随机排列。我们可以用各种方式（如SPSS、Excel、SAS等）产生一串随机数字，比如：925912648239817213……
- 因为只有6种排列方式，因此可以只选择1-6之间的数字，251264231213……
- 按照上述随机数字排列区组。至此，区组随机化就完成了，两组人数完全相等。

随机分配规则(Random allocation rule)

随机分配规则是限制的最简单形式。对某一特定的整体样本大小，它仅确保在研究结束时样本大小相等。通常，研究者定义一个整体样本大小然后随机选择样本中的一个子集分配到A组，剩下的分配到B组。例如，总样本量大小为200，在一个帽子里放100只A组的球和100只B组的球，将它们随机拿出来并且不再放回帽子里，这就是随机分配规则的符号化。
生成序列时会随机指定100个A组和B组的分配顺序，这个方法将整个研究总体当作一个大的区组，即此平衡通常只在试验结束时达成，而非贯彻整个试验过程。
随机分配规则保持了简单完全随机的许多优点，尤其对统计分析而言；但是有更大的出现变量不平衡，即机遇性混杂(chance confounding)的概率。值得牢记的是这种不平衡在样本量更大时变得微不足道。此外，随机分配规则相较于简单完全随机化，不可预测性有所影响。特别是在一个非双盲试验中，通过猜测分配(序列)可导入选择偏倚(尤其在接近试验结束时)。但是这显然不会存在于区组较小的排列区组随机化方法中。
研究者有时通过限制性洗牌法(restricted shuffled approach)执行随机分配规则，包括确认样本大小、按分配比率为每一治疗方案准备特殊的卡片及指定一个数字，将卡片放在信封里，打乱它们产生一个无替换的随机分组。许多研究者可能使用这一手段但很少称之为限制性洗牌法或者随机分配规则。取而代之的，他们报告说应用信封或洗牌法(use of envelopes or shuffling)。的确，严格洗牌(打乱)手段将分配序列生成和分配隐藏整合在一个过程里。洗牌法决定分配序列，这不是最主要的。最重要的是，使用信封进行充分的分配隐藏保证了能充分应用有限制的洗牌法。

偏性掷币法、瓮随机化法、替换随机化法和最小化法，又被称为动态随机分组

偏性掷币法和瓮随机化法(Biased coin and urn randomisation)

偏性掷币设计(Biased-coin design)可以达到与区组法相同的目的而无需强制严格平均。因而它几乎完全保留了简单随机法的不可预测性。偏性掷币设计在试验过程中改变分配概率以纠正可能发生的不平衡性(Panel 4)。研究最广泛的是将适应性偏性掷币设计(Adaptive bias-coin designs)和瓮随机化设计结合起来的方法，即基于不平衡性的程度改变分组的概率。
偏性掷币设计，包括瓮随机设计(urn design)，在报告中不常见，但它们可能使用得更频繁。利用电脑比真的从瓮中拿球更简单、更可行，正如使用电脑比掷币进行简单随机法更简单和更可靠一样。非盲法试验中的不可预测性是最重要的，并且因需要样本大小平衡而排除了使用简单随机法，瓮随机化设计就变得尤其重要。无论排列区组法使用固定或随机改变区组样本大小的方式，瓮随机设计的不不可预测性均胜过排列区组法。如果读者遇到一个偏性掷币法或瓮随机设计，则应认为其具有恰当的序列生成过程。
偏性掷币法和瓮随机化法
- 偏性掷币设计在试验过程中通过改变分配概率从而在各组人数间纠正可能发生的不平衡性。例如：研究者们可能使用均等分组的概率来进行简单随机化(两组试验，0.50:0.50)，直至分配到各组的数字差异性始终低于预设的限定值。如果差异性恰达到限定值，则研究者要提高人数较少那组的分配概率(如0.6:0.4)。恰当地执行偏性掷币设计能达到平衡同时保留与简单随机法有关的最大的不可预测性。
- 动态偏性掷币设计，结合被研究得最为广泛的瓮随机化，是基于不平衡性的程度而改变分组概率的方法。瓮随机化设计按UD(α,β)设计，最初的蓝色球和绿色球的数量都是α，β代表放到瓮里的与选到的球颜色相反的球的数目（α和β是任何合理的非负数)。例如UD(2,1)，一个瓮里有两个蓝球和两个绿球：以0.50/0.50的概率开始分组(α=2)。随机地拿一个球并以它代替治疗方案分组：蓝色代表A治疗，绿色代表B治疗。每次额外放一个（β=1)和所选球颜色相反的球入瓮。如果先选到一个蓝球，则首次分组后瓮里有两个蓝球和三个绿球：按0.40/0.60进行下次分组。如果第二次再选到一个蓝球，则第二次分组后罐子里有两个蓝球和四个绿球：0.33/0.67的概率进行下次分组。每次分组重复这种拿球程序。分配概率受之前的分组情况影响而波动。

替换随机化法(Replacement randomisation)

重复简单随机分配方案直到达成某一预期的平衡。试验研究者应建立一个用于替换的客观评价系统。例如，一个300人参与的试验，研究者应注明假如各组间大小的差异超过20，则他们应替换一个简单随机化方案。如果第一次生成的方案的差异大于20，那么他们应生成一个全新的简单随机化方案以替换第一次的尝试并按照他们关于差异度(disparity)的客观标准检查之。他们将如此重复直至有一个符合他们的标准的简单随机化方案。尽管替换随机化方法看上去有些武断，只要是在实验开始前执行这个方法，那么它就是充分的。
此外，它易于实施，能确保合理化的平衡，并包括了不可预测性。
其主要的缺陷是不能确保期中分析所需要的试验全程的平衡性。尽管使用得少，这个方法是最早产生的有限制的随机化方法的形式。

最小化法(Minimisation)

比如某研究者要做A、B两种术式的近期疗效研究，采用RCT设计，在研究开展前该研究者就认识到：研究对象的年龄、疾病分期和病理类型是影响疗效好坏的重要因素。所以在研究分组中，研究者想达到在随机分组之后，A、B两个术式组在年龄、疾病分期和病理类型上基本保持一致。这样再去探索A、B两组的疗效，就会比较好解释。
基于这个“均衡多个影响因素”的目的，最小化随机就比较合适。它的实现过程是：
- 确定需要平衡的影响因素、各自的权重和目标组分配概率；
- 第一个研究对象完全随机分组；
- 从第二个研究对象开始，计算该研究对象被分组特定组后，两组间的预后因素差异大小；
- 按照差异最小化的原则，将该研究对象按照分配概率进行随机分组。
- 这个计算过程从第二例研究对象入组开始，就被一直计算着，每入组一个研究对象就需要计算一次，听起来比较麻烦，下面举例说明（由于差异大小有不同计算方法，下面采用极差法举例）。
假设年龄、疾病分期和病理类型的权重分别是1、2、3，目前入组的16个病人分组如下图:

组别 Age<50 Age≥50 疾病分期1期疾病分期2期病理a型病理b型

A组 3 5 3 5 4 4

B组 4 4 3 5 3 5
- 第17个患者是≥50岁，1期b型，计算两组差异大小：
- 假设入A组，差异为$(6-4) \times 1 +(4-3)\times 2+(5-5)\times 3=4$
- 假设入B组，差异为$(5-5) \times 1 +(4-3)\times 2+(6-4)\times 3=8$
- 这时候根据差异最小化原则，我们优先将第17个研究对象分入A组。
最小化法有明显的优势：能够很好地平衡影响因素在两组的构成情况。但是它也存在缺点，就是随机分组过程复杂，另外研究结果的数据统计分析是否可以采用常规的统计方法尚有些争议。
最小化随机分组过程的复杂，目前已基本不是问题，随着智能手机软件的广泛应用，这些简单的计算都很容易实现。
看了上面的例子，也许你会觉得最小化随机没有必要，完全可以通过分层区组随机来实现。但是如果样本量较小且分层因素较多，分层区组随机开展起来就比较困难。有研究显示，在将100人随机分到2组时，最小化随机可以同时保障20多个影响因素的均能性，而此时分层随机就不容易进行。所以最小化随机一般用于需要均衡多个影响因素，且样本量不大的随机分组过程。
最小化法(Minimisation)体现了分层和限制随机化的基本观念。它可以使得不大的几个组之间在几个特征上非常接近。最小化按其最严格的本意来说可被看做非随机法，但是在应用中，我们倾向于取其随机化的特征部分。最小化有支持者有反对者。在任何情况下，使用最小化法的研究者都应防止试验执行者获知随后的分配信息及任何有助于猜测随后分组情况的信息。

组别	Age<50	Age≥50	疾病分期1期	疾病分期2期	病理a型	病理b型
A组	3	5	3	5	4	4
B组	4	4	3	5	3	5

（三）分层随机化方法(Stratified randomisation)

随机化可以在治疗组间的基线特征上产生机遇不平衡性(chance imbalances)。研究者有时对重要的预后因素进行预随机化分层以避免不平衡性，如年龄或疾病的严重程度。在这种情况下，研究者应注明限制性的方法(通常是区组法)。为了获得分层的益处，研究者必须使用一种有限制的随机化方案以按潜在的重要预后因素对参加试验的受试者分层，在各层水平产生独立的随机化分组方案。没有限制的分层什么也不能达成（即安慰剂分层)。
试验中的分层在方法学上是有效并有用的，但是理论和实用的问题限制了它在计划的新试验中的使用。在大型试验中，随机化总是能产生平衡的分组，而分层除了增加复杂性之外，并不能带来什么好处。此外，如果不平衡性增加，研究者可以用统计学的方法在预后变量上校正(最好预先计划好)。最值得考虑的是分层增加的复杂性可能降低了试验合作者的参与性，或者在繁忙的诊所内招募受试者的合作性，任何一条都影响招募。因此，在大型试验中进行分层带来的益处少，且同时实践上有缺点。
但是注意一个重要的例外，在多中心研究中按中心分层既确保了有益之处，又不会增加各中心操作的复杂性。而在有的大型多中心试验中，试验者通过中心随机化来落实分配序列，这也可能是一种例外。中心随机化(central randomisation)减少了实践中分层的不利因素，且各中心可通过小样本量获得收益。
分层在小型试验中可能有用，因为它能避免有关预后因素的严重不平衡。它能提供足够的平衡性(有关分层因素的)和可能提高一点统计学把握度和精确性。但是一旦每组受试者超过50人，分层所获得的好处就减少了。此外，如果研究者在各亚层之间寻找精确的平衡性，分层可能直接导致负面效果。为了获得准确的平衡，研究者通常使用小的、固定的区组样本大小，其结果是损害了不可预测性。

五、将序列生成和序列实施分开

研究者经常忽略(通常不是故意的）随机对照研究设计和报告的另一个重要成分。在所有方法中，制定生成分配方案（顺序）的人不应该参与确定受试者是否适合入选，也不参与实施治疗方案或者分析结果。否则的话，他通常有权限获得分配序列表并因此有机会导致偏倚。
试验中这个部分的错误可以形成一个导致偏倚乘虚而入的缝隙。CONSORT指南（CONSORT statement)的第10条(实施)提到了有关的内容。
因此，研究者应在报告中陈述谁生成了分配序列，谁入选受试者及谁分配入选的受试者。
生成分配序列方案的人应与入选及分配受试者的人不同。然而，在某些情况下，研究者可能不得不既要制定生成分配序列，又要入选或分配受试者。在这种情况下，研究者需保证分配序列方案的不可预测性，并将之锁起来，防止他人尤其是自己拿到。

六、小结

随机对照试验建立了医学研究中最好的理论标准。其关键词是随机化，并需要恰当实施。
随机序列的生成花费的时间和精力很少，但是之后可获得极大的科学的精确性和可信性。
研究者应该投入合适的资源以生成恰当的序列并清晰地报告他们的方法。

临床研究基本概念：随机对照试验（四）

发表于 2018-08-02 更新于 2019-02-28 分类于临床研究

说明：
1. 部分参考Elsevier/The Lancet出版的The Lancet Handbook of Essential Concepts in Clinical Research

随机试验中的不均等样本量分组：避免猜测

一、摘要

普遍的概念认为随机试验需要产生样本量大小相等的各个比较组，对此我们深感不安。
不幸的是，这种概念上的误解导致研究者强行达成样本量相等而产生偏倚，尤其如果应用的是不科学的方式。
简单的非限制性随机试验（类似于重复抛硬币)，各组的样本量应该显示出随机变异性。换句话说，不同比较组的数量有差异是可以预计到的。在简单随机对照试验中，各组的相同样本量是被修饰过的，并不科学，因此，其他的有限制性的随机方案通过非简单随机而强制平衡各组样本量。
强制相等的各组样本量对分配的不可预测性有潜在的损害，特别是在非双盲试验中应用的排列区组随机化法。不可预测性的削弱可以使试验产生偏倚。
整体来说，研究者较少使用简单随机法，而过度使用了固定区组随机法。
对于大于200名受试者的非双盲试验，研究者应该使用简单随机法，并接受样本量的适当差异。这种不可预测性反映了随机法的本质。我们认同产生的轻度不平衡的分组样本量，并鼓励采纳这种不平衡性。
对于总体样本量小于200的非随机双盲对照试验，或者在非随机双盲对照试验的主要分层及亚组中，瓮随机化法比区组法更能增强不可预测性。
我们的混合随机方法是一个更简单的选择，它可以在现今理解的简单随机法和排列区组随机化法的背景之下获得不可预测性。简单随机法提供不可预测性，而排列区组法在提供平衡的同时避免了绝对平衡会导致的选择偏倚。

二、前言

在随机对照试验中，尤其是使用排列区组随机法(permuted-block randomisation)的非双盲试验(non-double- blinded trials)中，绝对均等的样本量对提高统计学的把握度(power)没有什么帮助，而且潜在地威胁了不可预测性。
参与随机试验的人无法预见之后的治疗分组，因而不可预测性(unpredictability)反映了随机法的要旨(essence)。而预测性则带来偏倚。
除了简单非限制性随机法之外的其他随机法产生更多的可预测性。这些不同的方法被称为有限制的随机化方法。假定最常期望的分配比例是1:1的话，有限制的随机化方法通过限制治疗分配而产生贯穿整个试验的相似的、或者常常基本上相等的各组样本量。有限制的随机化方法都牺牲了不可预测性，但是预测性最为明显的是在非双盲试验中应用排列区组法(permuted- blocks)(panel 1)。
试验者依赖于不可预测性带来的安全性。过去，我们建议培养对简单随机试验中不均等的样本量大小的接受能力。现在，我们建议也要培养对有限制的随机试验中不均等的各组样本量的接受能力。
Panel 1：分配序列中的不可预测性
- 可预测性(predictability)在临床试验中产生偏倚。如果试验研究者弄清或预测到随后的分配分组，他们就会引入选择偏倚。在评估是否合格时，他们可以排除在他们看来指派到错误分组的受试者。甚至，若干技巧使得他们可以引导预后好的受试者分配到治疗组，而预后差的受试者到对照组，反之亦然。无论这样做的原因是什么，试验者让对比产生了偏倚。临床医生可能在诊疗患者的时候注重可预测性，但是他们必须明白这种可预测性在临床试验中会大量地引起偏倚。
- 试验研究者破坏了分配隐藏机制后能猜到下一个分组(例如：把半透明的信封放到亮着的灯泡下)。但是，恰当的分配隐藏通常会防止这种破坏。另一种情况是试验研究者用排列区组法有时候可以通过之前的分组特征猜出下一个分组。比如，在一个区组大小为4的非双盲试验中，如果试验研究者注意到每4个受试者入组后两组的样本大小是相等的，那么就能预测许多之后的分组。举例来说，如果区组大小为4，出现ABA这样的序列，那么B必然是下一个入组的，或者出现BB，AA就是后两个入组的。
- 在非双盲试验中，哪怕有恰当的分配隐藏，所有的干预分配在分组之后也成为可知的。因此，如果出现一种分配序列的模式，试验研究者就能辨识出来并预测一些之后的分组。但是，如果不出现分配模式，或者模式是不可辨识的，则分配序列是不可预测的。因此已知从前的分组不能帮助预测之后的分组情况。不可预测性是非双盲随机试验的要旨。
- 在分组前进行恰当的分配隐藏，分组后对所有参与试验的人恰当设盲使得之前的分组不可知，从而防止预测之后的分组。恰当的设盲减小了对不可预测性的需求。但是，即使在本应是盲法的试验中，分组后的设盲并非总是成功的。例如，如果试验研究者发觉病情进展很快，从临床角度来说显然是副作用所致，这样就暴露了所指定的干预措施，因而盲法也不可能防止预测。

三、强行修饰的可信度/Forcing cosmetic credibility

随机化研究的报告中出现各比较组的样本量大小均等的情况比预期的更多。在简单非限制性随机对照试验中(类似于重复拋硬币)，各比较组样本量的相对大小应该体现随机变异性(random variation)。
换句话说，相比较的分组样本量的不同是可以预见的。然而，对普通医学和专科医学杂志所报道的试验分析显示，研究者过于频繁地报告比较组之间的样本量大小均等(定义为绝对均等，或在总样本量大小为奇数时近似相等)。在专科杂志中，报告各比较组的组间样本量存在差异的数量与预期的相距甚远(p<0·001)，并且在简单随机(非限制性)试验中54%的样本量都是相等的。这个结果高于区组法试验(36%)，而区组法试验中是追求均等的。此外，关于皮肤病学文献的相似分析的结果显示，71%或者更多的简单随机试验报告了绝对相等的各组样本大小。
为什么研究者寻求相等或相似的分组样本量？我们感觉到许多研究者把得到相等的样本量作为终极任务。相等样本量有着被称为“修饰的可信度(cosmetic credibility)”的诱惑，这种诱惑是如此明显。可悲的是，读者们也被修饰的可信度吸引了。但是，努力用简单随机法来达成均等的样本量大小在方法学上是不合逻辑的。
前文提到的占了很大比例的均等分组样本量标志着这个偏差不是由机遇产生的，并提示非随机化法操纵着分组以达成强行均等。其他合乎逻辑的解释看来不错，但可能不能说明我们所看到的偏差。对分组的这种胡乱修补由于将选择偏倚引入试验中而造成难题。我们希望消除获得绝对均等样本量的动机背后的神话，从而解决这些难题。
不过，除了非随机化法操纵分组的问题外，我们将会关注用有效的限制性随机方法在达到各组样本量大小平衡时带来的潜在偏倚，首先是排列区组随机法(permuted-block randomisation)，它在整个试验过程中产生均等的样本大小。遗憾的是，用来确保均等的样本量的方法有利于正确预测未来的治疗分组，使得偏倚渗透进来。

四、有限制的试验中的不均等样本量分组

限制性随机化方法是用来平衡样本大小的。这种平衡通常能增强统计把握度，并在试验期间可能进行治疗效果或结局的测量(measurement)的时间点上表现出来。此外，层内的有限制的随机化法对要从分层中获益的研究者而言变得至关重要。因此，科学合理的理由可为限制提供支持。
但是有效的限制并不需要产生完全相等的样本大小。一个试验的把握度对组间样本量上的轻微差异并不敏感。因此，产生相似的样本大小的限制性方法和产生相等的样本大小的限制性随机化方法所带来的把握度(power)、时间趋势(time trend)和分层益处(stratification benefits)是几乎一样的。
但是相等的样本大小可能带来不良后果。主要的限制性随机化法是随机排列区组法(blocking)(区组化)。总体来说，这种方法能很有效地达到在各个比较组之间（以及如果分层的话，在各层之间)获得相等的样本大小的目的。此外，每个区组分好后，也产生相同的样本大小。但也由于这样的作用，它带来了可预测性的不足之处。
尤其在非双盲试验(non-double-blinded trial)中，可预测性是最大的弱点。我们将双盲试验定义为受试者、研究者和结果评估者对其中的治疗方案都不知情。事实上，所有非双盲试验中，有的研究者会知道治疗方案。因此，即使有充分的分配隐藏，在分组之后治疗方案还是变成可知的。有此信息，试验研究者可以解码固定的区组大小(假定组织者最初是不对他们公开所有的区组大小信息的)，然后预计何时会出现各组样本量相等(Panel 1)。通过之前的分组特征可以猜出分组序列，之后的分组也可以被准确预知。因此，无论分配隐藏的效果怎样，都导致选择偏倚。在一个双盲试验中，如果明显可觉察到的治疗副作用迅速出现的话，同样的难题也可出现，虽然程度较轻。
如果整个随机对照试验中区组大小保持固定，则区组的大小，尤其是小区组（比如小于等于6个受试者)，容易被破解。因此，如果研究者使用区组随机法，应该变动区组大小以减少分配表被那些负责入组和分组的人获知的机会。
但是区组大小的随机化不是万能药。即使随机变动区组的大小，区组化在整个试验的过程中还是会多次出现各组样本量相等的情况。区组大小随机化能帮助减少选择偏倚，但是某些情况下可能不会消除它。即使使用随机的区组大小，排列区组随机法表明试验招募者仍有机会预计到某些分组。

五、非双盲试验中的不同选择

（一）简单随机法(simple randomisation)

对于总样本量大于200人的非双盲随机对照试验(两组的平均样本量是100)，以及在每个计划的亚组内或者层内，我们推荐简单随机法(simple randomisation)。它提供完美的不可预测性，从而通过分配序列的生成消除选择偏倚。此外，简单随机化在各种序列生成过程中出现机遇偏倚的可能性最小，而且它还使得几乎所有标准统计软件都能可靠地应用。
样本量大小超过200，简单随机化通常仅产生轻度不一致的组间样本量。然而，200的截点仅仅是一个整体的指导。各个研究者可能想判断各自特定的可接受的不一致程度。
小于200的样本量的期中分析（即：在研究者完成全部样本量之前)也需要注意。这种情况下，各治疗组间样本量的不一致性会相对较大，不过我们认为简单随机化的不可预测性更多地补偿了这种损失。

（二）有限制的随机化方法

对于样本量小于200的非双盲随机对照试验，或一个分层试验中的任一主要分层或者亚组中，我们推荐使用有限制的随机化法。尤其是瓮随机化法设计能很好地促进而非强制达成平衡。
它倾向于在一个试验重要的早期阶段多做平衡，之后当试验样本大小增加时进行简单随机化。这一作用在整体试验样本大小不确定的时候，或者更可能在分层试验中分层大小不确定的时候，都是有用的。在持续检测治疗效果且随时可能终止的试验中，它也证明是有用的。瓮随机化法的设计通常有充分的平衡性，同时比排列区组法更不易出现选择偏倚。
这些理想的特性也带来了警告。有的统计学家推荐在瓮随机化的设计中使用置换检验(permutation tests)。置换检验是治疗效果相同性的无前提假设的统计检验。遗憾的是，标准统计软件中通常不对瓮随机设计提供这种检验。这增加了研究者和统计学家进行分析的复杂性。然而，如果结局变量不出现主要的时间趋势，瓮随机试验用常用的统计软件进行标准统计分析通常产生与置换检验相似的结果。此外，用标准统计分析，研究者可以很容易获得常见的效果测量的可信区间。
令人惊讶的是，报告中不常出现瓷随机设计或其他形式的偏性掷币（biased coin)的设计形式。另一个可能阻碍瓮随机化法广泛应用的原因是其概念上的复杂性。它比简单随机化或排列区组随机化要难以理解。无论什么原因，瓮随机设计都在黯然消逝。

六、混合随机（mixed randomisation)

(一)混合随机的设计

我们现已尝试在已有的临床流行病学知识基础上建立一种方法。我们想要一种能总体上达到瓮随机化的不可预测性，且其不可预测性在小样本试验中更甚之，同时又没有其显而易见的复杂性的有限制的随机化方法。
我们的解决方法混合了简单随机化法和排列区组随机化法。
- 简单随机化提供不可预测性。
- 排列区组随机化则提供平衡。
- 混合方法由替换随机化程序(replacement randomisation procedure)生成一个不均等的区组开始(panels 2 and 3)。
- 随后就是最简单的方式，区组大小变动的标准排列区组。
- 这种排列随机化顺序在一开始就建立不均等性，使得剩下的试验中任何对分组的预测都不可能。
替换随机化方法基本上是简单随机化，但有一些轻微的改动。因为研究者应该力求一个不均等区组，他们会事先对各个分组之间的样本量大小设定一个不等度。然后用简单随机法准备分配序列，检查样本大小间的不一致性与他们预设的不等度之间的差异。若样本间的不一致性等于或者超过他们预设的不一致性，则本次简单随机化分配顺序可用于第一次不均等区组大小的要求。如果不能的话，则生成一个全新的简单随机序列替换前一个。他们会重复此过程直到生成一个简单随机序列等于或超过他们预设的不一致性(panel 2)。第一个不均等区组的区组大小整体可以是奇数或偶数，且几乎可以占总样本的任意比例，不过我们设想它通常落在5~16之间。
我们的基本方法是在试验中形成初始的不平衡。替换随机化只是代表一种达成它的方法。也可以从随机不平衡排列区组法(random imbalanced permuted blocks)或其他由这个主旨变化而来的方式中选择。
如果研究者能接受不一致性的变化，有另一个又好又简单的方法，即将第一个区组的大小设定为一个奇数，这至少确保了一定的不一致性，又可以只需使用简单随机法(没有替换随机化）。
关于第一个区组的可接受的预设不等度的确立是很不敏感的。即使治疗组的总样本量按2:1比例分配时，试验的把握度也不会明显下降。研究者仅需要产生比这小得多的不等度，尤其在分层试验的样本量小的各层中。确保在差异度小的时候能和差异度大的时候产生一样的不可预测性。此外，实际上不一致性能通过增加不可预测性轻度地增加试验的把握度。

比如：在比例检验(tests for proportions)或者生命表检验(tests for life-tables)中，最大把握度是通过不等的治疗组样本大小获得的。
在第一个不等区组之后，研究者应该进行常规排列区组随机法(panels 2 and 3)。我们建议随机改变区组的大小，且尽可能增加实际可行的区组的长度以得到较大的不可预测性。为了增加不可预测性，研究者可以在试验期间不时用替换随机化方法生成几个额外的不等区组。如：
- 在超过下50个受试者之后的一个排列区组后插入另一个不均等区组(用整个区组则意味着下一个不等区组很可能从50之后开始)。
- 另一个选择是，对这些插入的区组，研究者可以仅用简单随机化方法。这会稍微简单点，很可能会提供额外的不可预测性，也提供更多潜在的分配序列。其他的选择也可以产生这样的插入区组(如不平衡排列区组)，但这已超出了本章范围。
对分析来说，我们建议用可供使用的统计软件做标准统计分析(即更简单的方法)。
- 基于设计的置换检验可以稍微提高一些假设检验的信度(credibility)。
- 但我们更喜欢标准统计分析所产生的可信区间。
- 我们也同意在分析中对区组的忽略是可以接受的。
- 如果结局有时间趋势，在区组试验中这种简单直接的方法则通常产生比较保守的结果，否则，其结果与合并忽略区组的分析法相似。
比起缺乏不可预测性而增加的潜在的选择偏倚效应来说，上述的问题是微不足道的。一旦试验中渗入偏倚，它会变得根深蒂固且通常不易被察觉。除非在有限的情况下，研究者可能用一种创新的检测方法。
当前，在排列区组随机化试验中关于标准统计分析与置换检验，或非区组分析与区组分析之间的比较，总是关注于表面上的P值或把握度的小小增加。但无论选了何种分析方法，许多情况下对试验的阐述是相同的。更重要的是不同于选择偏倚，研究者对分析方法有直接补救的方法。如果杂志编辑或者统计学审稿者坚持要用另一种不同的方法，通常研究者可以重新做一遍区组分析或置换检验。总之，研究者应尽力关注于在设计和执行试验中防止偏倚，采用一种不可预测的分配序列就是努力的一部分。

(二)混合随机法的步骤(Panel 2)

第一步：用替换随机化方法在第一批受试者中生成一个不均等的区组
- A.确定第一个不均等区组的区组大小。这个区组的大小可以是奇数或者偶数，或者任何合理的数目，不过通常在5~16的范围内。
- B.给第一个不均等区组的分组样本量指定一个预定不等度(inequality)。
- C.生成一个简单随机序列(例如：一个随机数字表或一个电脑随机数生成器)。
- D.检查由之生成的序列是否符合或者超出上述步骤B所希望得到的预定不等度。
- E.如果所有的治疗组A和所有治疗组B之间有足够的不等分布，进行第二步，否则，回到上述步骤C.(不断重复)。
第二步：为随后的受试者生成随机排列区组
- A.选择排列区组的大小。较长的区组（比如10到20)比较短的区组（比如2到4)更不可预测。大家应该更倾向于长区组，除非研究者需要在一个小型试验或者试验中的一个小的分层中有合适的平衡。例如，研究者可以选择8、10、12和14作为区组大小。
- B.生成随机排列区组，随机改变区组大小，如许多文章中所描述的。
- C.决定是否在试验中增加额外的不等区组或简单随机区组。如果不增加，用随机排列区组完成要求的样本量。或者指定一个插入点加入不等区组或简单随机序列。
- D.如果通过替换随机化插入另一个不等区组，重新执行第一步。如果插入一个简单随机序列，进行第三步。
第三步：生成一个在一组排列区组后插入的简单随机序列
- A.确定简单随机序列的大小。此样本大小可以是奇数或者偶数，或任何合理的样本大小，但是通常在5~16之间。我们建议用奇数以确保不平衡。
- B.选择按照之前建议的样本大小生成一个简单随机序列。
- 1. 继续进行第二步的步骤B。

(三)混合随机法举例

通过把握度计算，随机法方案要求整体样本量为100。研究者决定第一个不均等区组大小为10，预设差异度为第一个不等区组中的治疗方案A和B之间的受试者差异至少为4。
然后研究者执行替换随机化，选择简单随机序列大小为10，直至成功地生成了一个10个受试者的分组，其中治疗方案是A或B，—种方案比另一种方案的受试者至少多4个人。此序列为BABBBABBAB，实际上，3个A治疗方案，7个B治疗方案。
然后研究者决定随机将排列区组大小改为6或8或10或12之间的任意一个。此程序在接下来的研究中可以简单地继续下去，但是研究者决定在第40个受试者完成排列区组分配后插入一个大小为5的简单随机分组序列。随机选择的区组大小依次为12、8和10。简单随机序列从第41个受试者开始，为BABAA。
在此简单随机序列之后，研究者再次进行随机排列区组法，区组大小为6、8、10或12，第一个随机选择的区组大小为8。我们描述分配序列及前53个分组按治疗分配的累计分组情况。

七、要在研究方案中全部公布吗？

在研究方案中清晰地提供随机化方案的细节可能更方便破译分组顺序。我们推荐研究者不要在研究方案和研究者手册中完整描述他们生成方案的过程。他们可能不得不描述分层计划，但对执行试验的人要隐藏生成分配序列方法的所有细节。
有些基金负责人要求提交更多的文件以确保研究者了解合适的随机化方法。适当的原理和参考文献可能就足够了。如果基金机构要求更多说明，研究者应向基金会提供一份单独列出的生成分组序列的计划，而且不要和决定受试者入组的研究者共享。不过，在试验的最终报告里，研究者应该完整地记录随机化过程。

八、结论

研究者简单随机法使用得太少，而固定区组随机法使用得太多。这样做是因为他们没有充分理解不可预测性的重要性，并且过高地估计了治疗组样本大小相等的价值。
简单随机法是完全不可预测的，操作简单，且能用标准统计分析软件。对大于200个受试者的非双盲试验而言，研究者应更多地使用简单随机法，同时就算不赞美也要容许组间样本大小的不一致性。这个不可预测性反映了随机化的本质。
对于非双盲随机对照试验，如果总体样本小于200或在重要分层或亚组中，瓮随机设计相对于区组随机化增加了不可预测。
然而，我们的混合随机方法在目前可理解的简单随机法和排列区组随机化的联合应用中获得不可预测性。我们极力主张研究者至少在非双肓试验中应用这一方法。
为什么给试验的实施增加复杂性？答案是保护随机化的完整性的重要性高于一切。恰当的随机法使得偏倚最小化，甚于试验中任何其他方法学的特点：

"一旦随机化泄露，试验保证无偏倚的能力就彻底进了水沟。"

那些参加试验的人会费力破译随机化方案。因此，研究者设计试验时必须同样努力地挫败他们的企图。