5个步骤,手把手教你做循证
2021-5-18 来源:本站原创 浏览次数:4次大约10年前,读到并完整翻译了下面这篇文献,算是手把手,一步一步,帮助我系统地学习和理解了循证医学,受益匪浅。文章很长,估计能坚持读完的人不会太多,不过即使现在来看,仍然很有价值,与各位分享。翻译生涩,可以回复口令「循证」,下载该文献全文,阅读原版。循证医学摘要循证医学是指通过一套明确的流程,应用和评价相关信息,从而做出医学决策的方法。循证医学可能和通常的观念相反,由于通常无法获得既真实又完整的信息,它要求医生必须接受、权衡相关的不确定性。考虑到医学的不确定性,循证医学提倡通过以下五个步骤来做出合理的决策:列出可回答的问题;搜集证据;评价证据;应用有效的证据;评价整个过程。列出可回答的问题时须根据病例的具体情况进行明确的分类,以对从以往的研究中搜集来的证据进行比较。评价证据时可应用临床流行病学的相关手段,评估证据的有效性和适用性。应用有效的证据是指实施基于整合的证据以及医生的判断和患者的愿望所制定的临床计划。最后,循证医学还要求进行进一步的评价和改进、完善。随着医学知识库的不断发展壮大,在取得最佳治疗结果的要求下,循证医学的方法与同期的医学以及医生的临床实践有着非常密切的关系。循证医学的发展、推广堪称奇迹(图1),但什么是循证医学?为了评价循证医学的价值[1]评估其对临床实践的影响,我们必须统一其定义。因此,本文主要的目的,是为了明确循证医学的定义,并对其创建的临床流行病学方法和关键的评价方法作一综述。而另一个更为复杂同时也许更为有意义的问题是,如何近来如此重视循证医学。将循证医学阐述为一种新的临床实践模式,则意味着传统的方法并不遵循证据,当然这只是间接的评判,主流的观点中,没有人将西方医学和巫术、占卜等同起来。然而,这也提示以往的医学实践确实缺乏一种基于科学的模式。
图1在MEDLINE数据库检索「evidence-basedmedicine」,图示为年度引文数量变化趋势。
认为医学缺乏科学性,最为有力论据,主要来自有些研究报道显示临床实践上的差异远远大于疾病患病率的差异。例如,圣巴巴拉(加州)的医保患者中脊柱手术的比率约为布朗克斯(纽约)的5倍。因为不太可能有某种因素会导致疾病的发病率相差5倍,那么大概存在这样的患者,加州的医生表面上根据他们科学的见解,认为应该手术,而布朗克斯的医生,基于同样的理论,则认为不必手术。这样要么加州的医生在科学上是正确的,要么是布朗克斯的医生是正确的,但不可能两者都正确。在临床实践中相关的见解差异很大,但由此认定医学并不是以科学为依据的,这种观点显然不合适。反驳这些观点,需要说明做出临床决策时是如何应用医学证据的,即使具有最佳的证据,为何也只能使不确定性和差异变得尽可能小,而无法消除。循证医学的定义「循证医学」这一术语是指通过应用和评价信息做出医学决策的明确的方法。通常引用Sackett等[3]提出的定义「循证医学是指认真、明确、审慎地应用现有最佳的证据,针对患者个体的治疗做出决策的方法,应用循证医学的方法必须综合医生自身的临床专业知识以及现有最佳的来自系统研究的临床证据。」这一定义没有提到随机对照试验,也没有提到成本效益研究、规则系统或操作方法。然而,该定义的言外之意,做出医学决策是一个较为艰难的过程。另外,也是医生为何必须「明确地、审慎地」的原因。做出医疗决策很艰难,因为临床医生必须面对这样的两难境地:做出医疗决策所依据的信息既不完美也不充分。称之为临床决策不确定性原则:同时获得既准确又完整的信息是不太可能的。要理解这样的两难窘境,我们必须考虑到医学知识的本质。医学知识康乃尔大学医学院的院长曾在迎接新生的庆典上很遗憾地说道:「我们即将教给你们的有一半是不正确的,问题是我们并不知道是那一半。」虽然这种说法很显然有说笑的成分,但他的歉意确实源于事实。在历史的长河中,我们当前的认识其实很多都会被替换或修正。考虑到我们的信息至少有一部分是错误的,我们应该怎么做呢?将医疗实践局限在已经证明、既定事实的范围内,是无法保证安全的。规避所有未经证实的信息,同时也会使我们必须拒绝一些真实的,但尚未被证实的观点。在下面的示意图呈现了医学知识的总体情况,也阐明了这一现象(图2)。图2医学知识总体(U)示意图。A区域表示所有的真命题;B为所有经过验证的命题;C表示经验证且真实的命题,但并不包括所有真理。其没有包括的区域D所示为尚未被验证的真理。E所有经证实的伪命题。F为既不真实也没有被验证的命题。临床医生应用未经验证的知识时,希望他所应用的命题属于D区域,但实际上也可能来自于F区域。在这一整体中,有一个子集为事实上真实的观点,图示为A圈之内的内容。另外有一个子集为已经经过验证的观点,B圈,A和B的交集也就是C所示的领域表示已经经过试验证实为真实的观点,也就是临床医生所需要的真实有效的信息。但是很显然C所示的面积并不包括所有真理;C区域只是A区域的一个子集。临床医生如果将自己的观点仅仅局限于C区域,那么他就无法应用那些尚未证明的真理,也就是D所示的区域。但是如果临床医生希望从D区域获取一些尚未被证实的观点,则同样面临着应用A区域以外相关谬误观点的风险。鉴于此,我们的选择是,要么只应用已被确认的信息,尽管可能很少,或者冒险去应用未被证实的甚至有可能是错误的观点。译者注:尚未被证实的疗法并非完全不可用,但绝不可深信不疑,即使这样的观点来自于你非常敬仰和信任的权威和前辈。存在不少未经证实而可能是真理的命题,这很多是由于资源缺乏,并没有足够的时间和钱去证实所有的一切。但是更为根本的问题是,即使拥有无限的资源,也仍然有些真理我们无法确定其真实性。正如年KurtG?del开创的不完全性理论所言[4],「并不是所有的真理都能验证其真实性」。事实上,留给我们的经常是这样两个选项:一方面是有缺陷的,另一方面是研究不充分的。但我们必须得做出选择。正如寓言中所说的,将一头饥饿的驴子刚好放在两包干草料之间,向两个方向同样地拉,最后它会被饿死。在临床实践中,我们不能寄希望于所有的情况下都有完美的信息供参考。依靠手中的信息我们必须做出决策,这些信息有时甚至是不可靠的。面对这些不确定性,循证医学的方法可以帮助我们做出最明智的选择。循证医学的应用假定有一位患者,Smith先生,胫骨开放性骨折,医院予夹板固定后,转诊给一位创伤科专科医生,该医生希望运用循证医学的方法来处理。他认为该患者需要手术治疗,然而,他无法确定内固定还是外固定支架更好。如果他的原则是只有经大样本随机双盲对照研究证实了的方法才能用于治疗的话,那么这两个方法都不能选用,因为可能永远不会有这样的研究(由于有或没有一个庞大的外固定支架,这一点至少不可能对研究者实施盲法)。但如果这位医生按照这个原则两个治疗方案都不选用,那么他就实际上选择了第三个方案:对该患者继续进行夹板固定。也就是说他必须做出选择。为了做出明智的而不是随意的选择,Sackett和Haynes[5]推荐参照以下五个步骤应用循证医学的方法:(1)列出可回答的问题;(2)搜集证据;(3)评价证据;(4)实施这些证据;(5)评价整个过程。第一步:列出可回答的问题医生不能查阅文献后直接问「我该对Smith先生做些什么?」这一问题必须转化成一个可回答的形式,可能包括三个问题:谁是Smith先生(译者注:也就是「Smith先生的诊断分型如何」)?治疗的选项有哪些?如果我选择其中一个选项的话会得到什么样的结果?像这样列出这些可回答的问题后,则必须明确疾病状况、可能的治疗方案以及相关的治疗结果。明确患者的状况须先做出诊断,然后明确患者的特征,一般认为这和治疗是密切相关的。一名患者的情况应该包括年龄、性别、病史,和其他信息,比如骨折的部位和程度以及合并损伤等。检索结果是不可能有针对Smith先生本身的研究的,只有患者的一些共有的属性。这样临床医生应用其「个人的临床专业知识」,必须决定哪些属性是决定性的。例如,大多数临床医生都认同,一项成年女性胫骨骨折的研究与Smith先生的病情是相关的,而有关未成年男性胫骨骨折的研究则是无关的。这样看起来相比性别,年龄似乎是更为决定性的属性,但这种认识实际上就是个人临床专业知识的体现:小儿骨折相关研究的作者不太可能提供明确的警告,指出其研究结果不适用于成年患者。接下来再确定可能的治疗方案。这也是一个个性化的决策过程,因为文献中的那些选项可能无效或者不切实际。资源缺乏,医生自身技能的局限,存在其他的合并损伤可能限制其做出的选择。这样的方式是合适的:「文献中建议的方法为X,但对我们来说,Y更好」。当然,医生必须意识到,如果受他的限制而不得不做出让步,那么可能最好将患者转诊给其他医生。最后再确定相关的治疗结果。并不是研究人员报道的所有的治疗结果都对确定Smith先生的治疗方案有用。一项研究报道治疗胫骨骨折后的结果,可能会探讨骨折愈合的时间,患者获得骨折愈合的百分比,住院时间的长度,并发症的发生率或其他结果。哪一个是重要的,重要的程度如何,这都必须针对每一个病例做出个性化的决定。第二步:搜集证据针对某一专题搜集大量的研究文章相对简单。而从另一方面来讲,收集「收集现有最佳的来自系统研究的临床证据」则要困难得多。如果处理不当,文献检索则可能会被不相干的文献完全掩盖。这一点正如英国诗人对古代水手的悼词所说的「水,到处是水,但没有任何一滴是可以喝的」。面对大量的研究,如果识别「最佳的」成了一项艰巨的任务。本文的目的并不是讲授如何有效地检索文献,可能也无法仅仅通过一篇文章来阐明这一问题。这些技能通常须通过指导和培训,然后自身实际训练才能获得。从某种意义上而言,学习如何检索文献,类似于关节镜手术的学习过程:从接受培训教程开始,但必须不断地改进,精益求精。第三步:评价证据循证医学要求临床医生必须对医学证据进行评判,正如法院处理法律证据一样。这提醒我们,对医学证据进行评价时,意味着人们可能打开谬误之门。有关法律的这个比方也使一些错误的评论更加突出,有人仅仅因为有些医学观点没有被理想的证据所证实,就认为医学并不是以证据为理论基础的。毕竟我们也不能因为只有极少数的判决有照片(影像)作为依据,就认定大多数凶手的审判都是没有证据的。相反,我们接受各种类型的证据,采信其中更好的一证据,目击者的辨认,甚至供词确实都已经被证明是不完善的。因此,这一问题不是「证据是否完美」而是「证据好到什么程度」。在临床研究中,并不是所有证据类型的价值都是均衡的。在报道治疗结果的研究中,大多数流行病学家都认同以下金字塔形的证据等级:这一金字塔其实是各种研究的分级系统,每一个层次所代表的方法都比其下一层具有更高的证据等级。例如,一项队列研究显示的X比一个病例系列显示出相反的结果更有价值。然而,所有形式的证据,甚至包括那些低等级的,都是有价值的。因此,如果缺乏其他证据,将一个病例报告作为依据来应用也是合适的。不充分的证据与无证据并不一样。表1临床研究中常见研究类型的定义研究类型
定义
病例报告
单一患者的报告
病例系列
治疗方式相同的多例患者的研究报告,但没有对照组和比较组
病例对照
选定一组患有某种疾病的患者和一组未患有某病的受试者,检查其之前暴露的相关因素对该疾病的影响
回顾性队列研究
按照暴露或治疗不同将患者非随机地分组进行比较研究,暴露发生在开始研究之前
前瞻性队列研究
按照暴露或治疗不同将患者非随机地分组进行比较研究,暴露发生在开始研究之后
随机对照试验
将患者随机分配到治疗组或对照组,并进行前瞻性的随访
考虑到证据的分级系统如金字塔形——其结构越到顶部越尖——这也提示了重要的一点:最佳形式的证据通常最罕见。例如,在复习一组近篇骨科文献时发现,仅33篇是随机对照试验,并且其中很多都由于统计学处理不当而存在缺陷[7]。(图3)图3JBJS(A卷和B卷)和CORR一年内所有临床文献中各个研究类型的分布情况[7]。(1)随机对照试验与病例系列研究随机对照试验的研究结果通常是最有说服力的医学证据。为了评价随机对照试验的优势,我们将其与较弱的研究方法作一对比,比如更为常见的病例系列研究。假设有一个病例系列研究报告了50例膝关节骨关节炎的治疗结果,所有患者均报告通过关节镜清理术治疗后获得成功。那么这一研究能证明手术的效果吗?可能不能。我们必须考虑到该研究可能受到以下多种偏倚的干扰,例如:患者的选择:如果仅仅纳入通过手术治疗更倾向于取得较好结果的患者,这样的报告其最终的效果就会被夸大。缺乏对照:手术可能取得成功,但它是和什么相比?如果要说明一项治疗是有效的,那么至少必须与不同治疗方法处理的另一组进行对比。比如,通过客观的评价,其改善程度尚不足以说明这一治疗方法确实有效,或许骨关节炎的自然病程中,也有偶然改善的时期。那么必须另外设置一组没有接受治疗(甚至连安慰剂也没有)的患者,以确定该治疗实际的疗效。数据丢失:回顾性研究可能无法纳入所有接受治疗的患者。有的相关记录可能已经丢失。并且,现在询问患者他们多年前的症状,这样未必能想得起来所有相关情况,并且可靠性通常也不同。排除标准不严谨:一项关于手术治疗的回顾性研究,通常都不会纳入计划手术但最终没有接受手术的病例,其实这也是一种偏倚。患者很希望手术,而最终接受非手术,因此被排除出手术组,但这样选择性地剔除这些患者也会影响最终的评价结果。认知偏差:愿意手术治疗的患者,对于自己经历的所有手术相关的不适,他都会说服自己坚信手术是有益的——即使可能并非如此——以证实其当初决策的正确性。同样,对于外科医生来说,评价自己做的手术也很难做到公平。双盲前瞻性随机对照试验则可以避免这些偏倚。在这样的试验中,所有符合纳入标准的患者都被随机分配到不同的治疗组,这种随机分配可以防止只进行疗效可能最佳的治疗方法导致的偏倚,并可以与对照组进行对比。前瞻性试验中,研究人员可以预先确定相关的变量,并可以明确地从所有患者中全面地收集相关资料。而对于分配到某组的患者最终没有接受相应的治疗,则其退出的偏倚也可通过意向治疗分析来进行矫正。此外,让患者和评价者都不知道给予的是何种治疗方式(所谓的双盲)可以限制由于心理作用导致的偏倚。随机对照试验的价值就在于其对偏倚的控制,但这些试验也并不都是绝对可靠的。在一些极端的情况,随机对照试验据说证实顺势疗法是有益的[8],对于该方法,Park[9]证实不仅不符合医学原则,并且同生物学、化学和物理学的规律也是相冲突的。此外,这样的试验可能存在错误,或者至少存在统计误差。(设定P=0.05作为有统计学意义的标准,我们预先必须接受该研究有5%的机会可能会看到根本不存在的差异。)随机对照试验提供了良好的证据,当然也并不完美。如果你怀疑这一点,则可以想一想Skrabanek和McCormick[10]讲述的轶事。有位患者被纳入一项双盲随机对照试验,以研究某个药物的疗效。有一天,他突然问他的医生,为什么他的药变了?这位医生,由于盲法也不知道该患者到底属于哪个治疗组。于是答复该患者说他也不知道患者所说的情况,但他继续问道「你怎么知道你的药变了」。该患者答道「之前我把这些口服避孕丸扔到厕所里时,它们都会下沉,而这周我发现它们都浮在上面」。(2)病例对照研究其实,即使完美无缺的随机对照试验也可能并不是最佳的证据形式。有些问题通过其他方法来证实可能更为有效。比如评价「损害」的长期风险,病例对照研究或许是最合适的。例如,为了明确长跑是否会导致髋关节的骨关节炎,要对患者进行随机试验几乎是不可能的,这要求他们中的一部分去跑马拉松,然后等过了几十年后再评价两组患关节炎的比率。而病例对照研究或许是一个更好的办法,研究人员从患有骨关节炎的患者中,计算曾有长跑习惯的人群数量,并与无关节炎的对照组中相关人群数量进行比较。当然,病例对照的方法无疑是不完善的,因为出现症状的受试者可能更容易回想起其之前的暴露因素。同样,相关的因果关系也会受到明显的暗示,而不是证明。然而,通常如果在暴露和发病存在很长一段时间,或者相关疾病在研究中较为罕见的话,病例对照研究可能是最好的方式。(3)专家意见专家意见位于证据金字塔的底部,这一位置也表明了其意义:专家的教学是以其他知识为基础的。好的学生变成老师,教科书(不是期刊文献)成为他们特定领域的学习、研究内容。但作为证据的一种形式,专家意见则居于系统研究(系统评价)之下。其理由是以往有很多例子,专家的观点都存在明显的错误[11]。例如,威廉·哈维血液循环的基本概念就曾被「专家」严厉地批判过。Scott[12]指出,骨科领域也有其自身的例子。在一些小众领域,听取专家的意见则是最高形式的证据。例如,不久之前,心理分析中,很多成功的论证都是以「正如弗洛伊德自己所说……」而开场的。骨科领域相比心理分析则是以更加客观的理论基础作为依据,但我们的专业训练方法也与之类似,初学者都是向老师学习技能的。因为就相关基础理论而言,我们通常习惯于接受专家的讲授,而当他们变成推测时,我们可能也很难拒绝他们的观点。然而,我们必须记得证据的等级:专家意见肯定超过非专家的意见,但却低于高质量的临床研究。(4)个人观点个人观点(经验)是最弱的证据类型,我们很容易被我们自己的个人观点所迷惑,即使我们认识到相关事实并设法补偿也还是如此。首先,个人观点是以小样本研究为依据的。让我们来思考一下临床医生全膝关节置换术后不使用抗凝剂的情况。如果他观察到一个系列共10例患者没有进行药物干预也没有发生肺栓塞,他可能会错误地下结论认为抗凝剂是不必要的。而事实上,如果没有进行预防时肺栓塞的风险,比如为3%,那么临床医生在10例这种未经预防的患者中,不会遇到1例栓塞的可能性是很大的。由于这样的并发症很少,必须使用抗凝剂,这一事实可能只有在较大样本的病例中才能被证实。此外,个人观点也是一种没有对照的研究形式,正如Redelmeier和Tversky所说,人们认为世间的事都是合理的,并且可能会虚构很多说法来解释他们所看到的,而不管这些说法是否有依据。如果一例患者进行治疗后取得了良好的疗效,人们出于本性,都会简单地认为是这种治疗方法将疾病治愈了,因为治疗之后接着就痊愈了。这导致了时间先后与因果关系的混淆。如果在对照组中也观察到类似的改善,那么我们就不太会犯这样的错误。最后,个人观点通常存在回忆偏倚,如果一例踝关节扭伤的患者,我们没能发现其胫后肌腱的腱鞘还存在滑膜肉瘤,那么我们此后再遇到踝关节扭伤的患者时,可能会高估这一罕见疾病的诊断。第四步:应用证据准确地列出相关的临床问题,明确该患者可能的治疗选择,恰当地查阅和评价相关证据,则可提示这些治疗选项可能的治疗结果。做出医疗决策,就不会比从治疗结果清单中选择最佳选项更复杂。有时这一过程也很简单,而有时也可能充满了不确定性。不确定性的主要来自两方面。首先,搜集到的证据可能存在缺陷,临床医生不得不做一些增补,其次,某些疗效的相关价值也有可能存在差异。因此,即使对可能的治疗有很科学的理解,仍然会充满不确定性和差异。假设有以下这样一个病例,21岁的运动员膝关节扭伤2天,伴有疼痛、肿胀、关节线压痛,完善病史、体格检查、影像学检查并抽取关节液等标本,进行评价后,临床医生做出结论,该患者内侧半月板在半月板-滑膜结合部(即所谓的红区)存在撕裂,没有其他损伤。对此,有三种治疗选择:半月板修补,半月板切除及非手术治疗。在三种方案中做出最佳选择,其情形如图4的决策树状图所示,在这一树状图中,列出了所有的选项,从这些选项发出的分支,表示这些治疗方式可能的结果。这些分支的权重与获得该治疗结果的概率成正比,各分支的终点所分配的值相当于相应治疗结果的价值。图4半月板红区撕裂相关治疗选项和治疗结果的简易决策树。右侧方框代表治疗结果。指向它们的线条对应相应疗效的可能性,按比重赋值。P1是指获得结果1的概率。如图中所示,每种治疗方案只列了两种结果,虽然有更多的可能性。治疗的值为P1?UO1,该治疗方法所有治疗结果的总和。这样就可以对治疗方案对应治疗结果的加权平均数进行计算,从而明确相关治疗选项预期的效果。预期效果,是指每个终点(结果状态)的效果值乘以相应结果发生的可能性的总和。因此,选择最佳的治疗方案实际上就是选择期望值最高的选项。为了完善该病例的决策树,可应用以下有关结果的信息(假定)。红区撕裂1cm通过非手术治疗有90%的几率可以获得痊愈。在这样的患者人群中,半月板切除术6周内症状几乎肯定(99%)都会缓解,但是与此相关,10年内有40%的几率可能会发展成关节炎。此外红区半月板修补有75%的几率获得成功。那么现在可以根据这些数据确定最佳的治疗选择,但是事实上大多数关键的信息都是错误的:可能的治疗结果对患者有多少价值,或许治疗的价值会因患者而异。对于半月板红区撕裂,修补似乎是较为合适的选项。但是设想有这样的情况,一位大学四年级学生作为篮球队成员,希望2个月后参加国家锦标赛。而半月板切除术则是最为可靠的,有可能使其6周内重返赛场,这一点可能会促使她忽视关节炎的风险,并且会高估半月板切除术的短期效果。相反,如果某患者的父亲死于手术台上,则可能会使其对非手术治疗产生过高的评价,即使这样做将使其膝关节面临风险。由于骨科的很多手术都是为了缓解症状,手术的决定因素,通常是该治疗结果相关的效用,而确定这样的效用是非常困难的。我们必须确保所有的结果没有偏倚并且相关的效用值也都确切地记录在案。我们必须确定一个标尺以明确地标示各种形式的合适度。例如,「围手术期死亡」以及「能在高尔夫球场上走18洞」都是全髋关节置换术相关的治疗结果。虽然这些结果看起来没有一点可比性,患者事实上得冒着前者的风险以获得后者的效果。我们同时还必须解释风险转移,以及为了实现当前的价值,要忽视将来的效用。因此,半月板外周缘撕裂「合适」的治疗要视患者的偏好而定,即使你掌握了最佳临床证据也仍然如此。因此,圣巴巴拉(加州)比布朗克斯(纽约)的脊柱手术更多,可能仅仅因为各地的民众有不同的价值取向和个人偏好(当然,肯定也还有其他合理的解释)。此外,有关半月板治疗结果的证据清单存在关键性的缺陷。对于患者撕裂的大小或者基于影像学的确切评价,缺乏相关的信息。虽然确定了撕裂1cm的治愈率,但是大的撕裂的治愈率,或大小与治愈率的关系等均不清楚。如果组织没有愈合又是一种什么情况。最后,手术的并发症如何,发生并发症的可能性如何?对于这一病例要做出正确的决策,必须要有其他的资料,因此,需要一个比图4中所示的还要复杂的决策树。非手术治疗失败的治疗结果必须展开来,例如,非手术治疗失败后,或许还需要进行半月板切除或修补。同时,要做出更为准确的手术选择,还应考虑进行诊断性的关节镜检查,因为对一个小的撕裂,即使本来准备进行修补,也可能变得没有必要,或者发现存在无法修补的巨大撕裂,则不得不进行半月板切除术。最后这种两分法类似于「治愈」或「修补失败」,其实实际上并没有这么泾渭分明。这个例子显示,即使简单明了的病例,有明确且全面的治疗结果数据,决策也可能很复杂。Eddy的说法很贴切「远远超出单个人的思维能力」[15]。直到有更好的工具能辨别什么样的患者需要,或者有指南能给出明确的建议,所搜集的医学证据不可能总是发挥其最大的优势。第五步:评价整个过程应用循证医学时,对整个过程进行评价是必不可少的,虽然有可能出现问题。主要的困难在于,通常评价都是以个人观点为依据的,并且这些证据本身也可能存在偏倚。同时,在处理一些小样本证据时,由于统计学上的偏差也可能使我们做出错误的判断。由于个人观点存在的局限性,最好将评价作为大型监测工作的一部分。例如,对关节置换手术进行登记注册可能会有帮助,管理机构搜集的数据可能会提供有益的正反馈。例如,即使初级诊疗中心的临床医生,一年中一次骨密度测定也不会做,回顾该医生的有效数据,也可以建议他应该对预防骨质疏松症采取更积极的策略。当然,评价过程必须获得临床医生的配合才有可能有效执行。克服对循证医学的阻力实施循证医学的阻力,在临床医生中还是经常存在的。他们遵循的理论通常都不如循证医学,但尽管如此,他们也不愿接受。临床医生可能担心,应用循证医学需要较高的数学水平,然而实际上,循证医学无须应用专门的工具对数据进行处理,应用循证医学的医生也不必成为统计学家;他们唯一需要的技能就是如何应用统计学家做出的结果。按照Greenhalgh的观点,医生不要求会制造汽车,只要知道如何驾驶汽车即可。更大的阻力则可能是,有的医生认为循证医学侵犯了临床医生的专业自主权,由于循证医学的限制,临床医生自主操作的权力会被削减。正如19世纪,卢德派分子在诺丁汉市砸碎棉花织布机,以保护其工作的行为一样,这些临床医生在「错误」的方向上,以发展不完善的名义抵制循证医学。而最令人担忧的阻力,则可能是出于善意的,临床医生认为,循证医学在临床实践中难于操作。这一担心有其合理性,与以往任何时候相比,医生们可自由支配的时间被剥夺的情况都更严重,而阅读和评价文献又是很耗费时间的。例如,年一年Spine杂志MEDLINE的文献有篇,即使简单地