负二项回归和Poisson回归在改水降氟效果中的对比分析

作者:楚慧珠 郜艳晖 邹宇华 李伯灵。

【摘要】 目的: 探讨存在过度离散现象时离散数据的回归分析方法。方法:比较负二项回归和Poisson回归改水降氟效果评价资料的分析结果和拟合优度。结果: Poisson回归低估参数估计的方差,负二项回归拟合优度较高。结论:负二项回归可用于分析存在过度离散现象的离散数据。

【关键词】 负二项回归; Poisson回归; 过度离散; 地方性氟斑牙

Poisson回归常用于研究一个或多个自变量对事件发生强度的影响,这时模型要求结局变量服从Poisson分布,即事件的发生是独立的,且具有总体均数和总体方差相等的特征。但在医学研究中,很多事件的发生是非独立的,如传染性疾病、遗传性疾病、地方性疾病等等。这种资料的特点是观察到的变异(方差)往往大于Poisson分布的变异,即出现过度离散现象(over—dispersion)。一般来说,对此类资料可基于负二项分布,用负二项回归的方法来分析各种因素对事件发生强度的影响。本研究对广东省潮阳市的改水降氟资料,用负二项回归方法评价改水措施对降低小学生氟斑牙患病率的效果,并与Poisson回归进行比较。

1 材料与方法。

1.1 调查对象和内容。

调查对象为广东省潮阳市13个镇67个村共27840名小学1~6年级在校学生。检查在校学生氟斑牙情况(诊断方法采用三型九度法[1]),并调查各村改水年限,测定各村自来水和手压井水氟含量(水氟测定方法采用氟离子电极法)。

1.2 模型理论。

二项分布[2]是当Poisson分布中强度参数λ服从Γ分布时得到的复合分布。在Poisson分布中,λ是一常数;在负二项分布中,λ是一服从Γ分布的随机变量。因此负二项分布又称为Γ—Poisson分布。在Poisson分布中,事件数的方差等于λ;但在负二项分布中,事件数的方差等于λ(1+kλ),其中k称为负二项离散参数[3]。当k=0时,说明事件发生是随机的,此时负二项分布退化为Poisson分布;当k≠0时,说明事件的发生不独立因而存在着聚集性。当研究多个自变量对结局变量的影响时,可利用回归分析的思想。负二项回归模型与Poisson回归模型类似,也是对事件发生强度λ建模:

log(λ)=β0+β1x1+β2x2+…+βmxm。

式中,回归系数βi表示在控制其他自变量的情况下xi对事件发生强度的影响大小。回归系数和离散参数可通过最大似然估计得到。模型的拟合优度可采用Pearson χ2检验和Deviance残差图来评价。

1.3 统计分析。

利用SAS/STAT8.1中的PROC GENMOD模块拟合Poisson回归和负二项回归,误差分布分别指定为Poisson分布和负二项分布(NB),连接函数用对数连接。

2 结果与分析。

以小学生的氟斑牙患病人数作为结局变量,调查人数作为偏移变量(offset variable)。考虑的影响因素包括各村改水年限(年)、学生年级(1~6年级)、性别、各村自来水中氟含量(mg/L)和手压井水氟含量(mg/L)。改水年限不足1年者以0.5年估计。表1列出拟合二项回归和Poisson回归的参数估计结果。

1 次访问