可信限的计算在骨科研究中的应用

[ 下载 ]

【关键词】可信限的计算。

在医学研究中，结果常需做统计学分析，人们越来越对有统计学的显著性差异感兴趣，而忽略了所研究内容差异的大小，甚至发展到在文章中不提具体的数据结果，而只讲P值的大小。实际上大部分医学研究的目的正是后者。读者最关心的是新的方法与其他方法有多大的差异，而不仅仅是一个P值的大小。可信限要比一个单纯的P值提供更多的信息。可信限将一个样本的单一估计值(如样本均数)转变为一个能反映总体均数所在的范围。有许多杂志如British Medical Journal、Lancet等已要求作者在可能的情况下使用可信限，而不只是单纯的P值和有无显著性差异。但使用可信限对广大骨科工作者来说仍有一定的难度，因为在大多数普通统计学著作中没有将此类内容归纳整理，以便于应用。每一个研究结果作为一个样本均给总体一个大致的估计，而这种大致的程度是由可信限的宽度(或范围)来决定的。可信限的范围越大，这种估计就越不准确。可信限的范围主要取决于三个因素：第一，样本的大小，样本数越大，可信限范围越小，可信限范围很大表示所得的结果来自一个小样本，结果不可靠；第二，研究特征的变异性，变异性小，可信限范围就小；第三，可信的程度，最常运用的是95％可信度。可信限与显著性检验的关系。应用可信限与双侧假设检验之间有密切联系，从可信区间的结果可以推知假设检验显著性的水平。如在两个均数差的95％可信区间中不包含0，即表示统计学检验时P值小于0.05；如在两个均数差的99％可信区间中不包含0，则表示统计学检验时P值小于0.01。相反，在95％可信区间中包含0则表明统计学检验无显著性差异，即P大于0.05。95％可信区间给我们提供了总体均数可能存在的范围。但是，最有可能的仍是靠近可信区间的中间，而不是两端。人们常常批评在骨科研究中病例数太少，不易得出有统计学意义的结果。但实际上任何一个研究无论病例数多么少，均包含一定的信息。通过计算可信区间使我们在某种可信度上相信这个小样本所在总体某一事件发生的状况。当我们在比较两种或多种治疗方法时，在作出某一种方法优于其他方法的判断前，大多数杂志要求我们给出检验假设的P值，如果P值足够小，我们有理由拒绝检验假设，并确定这种差异是真正存在的而不是因抽样误差造成的。然而，当P值大于某一个人为的界限时(如0.05)，我们就拒绝检验假设，认为各种治疗方法间没有差别而不论实际情况如何。显然这种一刀切的方法是不妥的。而且即使统计学检验有显著性差异，我们也不知这种差异的大小。可信限给了我们一定范围，使我们在某种水平的可信度上相信总体真正值在这个范围内。下面我们用一个例子来加以说明。假定我们在治疗结核性关节炎时使用的某类抗结核药物有A和B两种药物可供选择，由于A药比B药价格贵，我们想知道两药对结核性关节炎的治愈率是否相同。A药和B药在四所医院进行临床试验，结果如表1所示。如果我们单作统计学差异显著性分析，从甲医院结果来看，A和B两种药物无显著性差异(P＞0.05)，人们很容易错误地认为A和B两种药物在治疗结核性关节炎时疗效相同。实际上这是由于甲医院所用的病例数较少，因而在做显著性检验能力时较低，不能发现可能存在的差异。从乙和丙。

表1 四所医院两种药物治疗结核性关节炎的结果　略。

医院的结果来看，A和B两种药物对结核性关节炎的治愈效果是相同的，但我们单看显著性检验时，在乙医院A和B两种药物无显著性差异(P＞0.05)，而在丙医院A和B两种药物有显著性差异(P＜0.05)，由此得出截然不同的结论。显然，此时我们不能得出A和B两种药物在所有结核性关节炎病人中的治愈率是否相同。只有从丁医院的结果我们可以较为肯定地得出结论：A药物在治疗结核性关节炎时疗效优于B药。然而由于所得的结论是从一个样本(丁医院)中得出，所以在人群中应用时我们不知A药对结核性关节炎的治愈率究竟高于多少。此时可信限的计算可告诉我们两种药物可能具有差别的大小。如果我们对上述资料做可信限的计算，从中可以看出可信限比仅仅表明有无统计学显著性差异提供更多的信息。从甲医院的结果来看，其治愈率差数的可信限为－19.4％～35.4％。当两组率差数的可信限中包含有0时意味着两组率之间统计学上无显著性差异，任何一种治疗可能好于另一种治疗。使用A药对结核性关节炎的治愈率可高于B药35.4％，而使用B药对结核性关节炎的治愈率可高于A药19.4％。从乙医院和丙医院的结果来看，其治愈率差数的可信限分别为－0.1％～38.1％和0.8％～39.2％，由此可知A药在治疗结核性关节炎的治愈率可能与B药相同或高于B药最多39％。也就是说在人群中应用时A药治疗结核性关节炎的治愈率可能与B药相同或高于B药最多39％。从丁医院的结果来看，其治愈率差数的可信限为10.4％～29.6％，我们不仅得出结论A药在治疗结核病关节炎时疗效优于B药，而且可知其好于B药的程度：我们有95％的把握说A药至少好于B药10.4％，最多可好于B药29.6％。从该例可看出当比较不同治疗效果时，可信限的计算比P值更有意义。前者不仅表明两种疗法是否有统计学显著性差异，而且提供了两种疗法可能具有的差别的大小，而不论P值有多小。当用可信限时我们可看出是否有临床意义的差别而不只是统计学显著性差异，因为有统计学显著性差异并不意味着具有临床意义的差异。在骨科研究的实际工作中，当比较不同文献中的研究结果时或将自己的研究结果与文献中的结果进行比较时，或者对文献中的统计学结果有疑问时，由于在文献中往往没有原始资料，无法进行统计学显著性差异检验，此时根据文献中提供的一些结果，如率、均数及其标准差、样本例数等可进行可信限的计算，从而得出不同结果间可能存在的差异。应当说明的一点是可信限并不是可以用在所有研究中，如描述性的资料就无法使用可信限，在某些情况下，计算可信限是极其复杂的或是不可能的。下面例举各种情况下可信限的计算(均采用95％的水平)。

0 次访问