关于寿命数据分析(威布尔分析)的置信限及计算方法
1、什么是置信限
在开展寿命数据分析(威布尔分析)的时候,可靠性工程师通常有一个疑问,使用样品的故障数据进行分析后,得到的估计结果的精度是多少,是否可信。估计结果的上下限或范围是多少。要回答通过故障样本数据得到的估计结果的精度问题,需要了解可靠性工程领域的一个重要概念——置信限。这也是可靠性工程师工作中必须要掌握、理解的一个概念。
为了更好理解置信限的概念,这里举一个简单例子——假设罐子里放了较多的围棋棋子,分别为黑色和白色棋子。第一次从罐子里抓出10个棋子,结果3个是黑色的,7个是白色棋子,由此我们估计罐子里面有30%的概率是黑色棋子。把这些棋子放回去,再抓一次,也是10个棋子,结果抓出来4个黑色的,6个白色棋子,由此我们估算罐子里有40%概率为黑色棋子。再抓一次,结果8个是黑色棋子,2个是白色棋子,由此我们估算罐子里有80%的概率为黑色棋子。此时,我们有点困惑了,到底罐子里的黑色棋子的概率是多少呢?
其实,这个问题主要是评估时所用的样本量大小以及使用样本估计结果估计总体的问题。当我们抓取罐子里的棋子次数足够多的时候,我们会发现黑色棋子概率估计值会逐渐接近50%。如果我们仅仅使用几个样本(次)的结果进行估计的时候,可能我们得到的结果是30%~80%的概率是黑色棋子。为了评估指定样本量下的评估结果的精度,需要引入置信限。以抓罐子的棋子为例,如果仅以前面3次抓取的黑色棋子的抓取结果进行估计,那么估计结果为30%~80%。也就是说,使用3个样本进行估计时,得到的黑棋概率的估计结果(置信区间)为30%~80%。
如果回到可靠性工程角度,我们通常是通过有限的故障样本来估计总体/全部产品的故障率。除非能够获得全部产品的故障数据(工程上很难获取全部产品的故障数据),否则都会存在使用部分样本来估计总体/全部产品的故障率的问题。这种情况下,就需要通过有限的样本量来估计出总体产品的故障率的范围。为了衡量总体产品故障率值落在不同区间的概率,需要使用置信区间/置信限(上限、下限)表示。
工程上常用的置信限包括费舍尔信息矩阵置信限、似然比置信限、贝塔二项置信限、贝叶斯置信限等。
2、费舍尔信息矩阵置信限
费舍尔信息矩阵置信限(Fisher Matrix Confidence Bounds)是寿命数据分析中较为常用的置信限计算方法。但是,在处理小样本的时候,使用该置信限时需要慎重,可以考虑使用其它置信限计算方法进行估计,比如似然比置信限。
费舍尔信息矩阵置信限计算时,首先根据费舍尔信息矩阵公式计算出的方差和协方差。如下公式所示。
$$F=\binom {-\frac {\theta^2\Lambda}{\theta\Theta_1^2}-\frac {\theta^2\Lambda}{\theta\Theta_1\theta\Theta_2}}{-\frac {\theta^2\Lambda}{\theta\Theta_2\theta\Theta_1}-\frac {\theta^2\Lambda}{\theta\Theta_2^2}}$$
然后,使用下面公式求出置信限(上限、下限),G是参数分布函数。
$$CB=E(G)\pm z_\alpha\sqrt{Var(G)}$$
通过多个样本的测试验证,PosWeibull软件的费舍尔信息矩阵置信限与国际上同类软件的计算结果基本一致。具体情况可咨询我们。
3、似然比置信限
3.1 似然比置信限计算公式
如前所述,在进行寿命数据分析时,通常使用费舍尔信息矩阵置信限作为估计参数的上下限计算方法。除了费舍尔信息矩阵置信限,还包括似然比置信限、贝塔二项置信限、贝叶斯置信限等多种不同的置信限。似然比置信限(Likelihood Ratio Confidence Bounds,LRB)方法比费舍尔信息矩阵置信限更为简单多,并且在样本量较小的情况下,LRB方法通常比费舍尔信息矩阵置信限的精度更好。
LRB的计算是基于似然比计算公式进行计算:
$$-2*ln(\frac {L(\theta)}{L(\hat \theta)})\ge \chi_{\alpha;k}^2$$
3.2 计算精度对比验证
现以实际数据验证PosWeibull软件的似然比置信限算法的精度(与国际上同类软件的计算结果对比验证):
(1)分布参数计算结果对比
假设故障数据为10,20,30,40,50,寿命分布为威布尔分布,使用极大似然法(MLE)进行参数估计,分别使用PosWeibull和国际上同类软件进行计算和比较。
将故障数据录入到PosWeibull软件,计算得到威布尔分布参数η和β分别为η=33.9429(国际上同类软件计算结果为η=33.9428)、β=2.29381(国际上同类软件计算结果为β=2.2938)。由此可以看出,分布参数估计结果相同。
(2)分布参数的置信限计算结果对比
计算时,选择基于似然比置信限方法计算β参数的双侧置信限,即计算β参数的上限和下限值。PosWeibull软件计算得到的β参数下限为1.142328195(国际上同类软件计算结果为1.142),β参数的下限值为3.949903234(国际上同类软件计算结果为3.950)。从计算结果可以看出,所计算得到的结果相同。
(3)故障时间的置信限计算结果对比
选择基于似然比置信限方法计算,可靠度选取R(t)=50%。PosWeibull软件计算得到的故障时间下限值t1为17.38853(国际同类软件计算结果为17.389),故障时间上限值t2为41.71422(国际上同类软件计算结果为41.714)。从计算结果可以看出,所计算得到的故障时间上下限结果相同。
图1 PosWeibull的分布参数计算结果
图2 威布尔分布β值的似然比置信限计算结果(国际上同类软件)
图3 PosWeibull计算得到的β值置信限结果
图4 故障时间的似然比置信限计算结果(国际上同类软件)
图5 PosWeibull软件的故障时间似然比置信限结果
从结果对比可以看出,所计算得到的β参数上下限是基本相同的。
四、贝塔二项置信限
贝塔二项置信限(Beta Binomial Confidence Bounds)的计算方法类似于计算中值秩的方法。贝塔二项置信限是一种非参数置信限计算方法。贝塔二项置信限方法可以用于任何分布,而不必根据假设的分布对计算方程进行调整。
$$p= \sum_{k=j}^{N} \binom{N}{k}Z^k(1-Z)^{N-k}$$
五、贝叶斯置信限
贝叶斯置信限(Bayesian Confidence Bounds)是基于贝叶斯规则进行推到得到的。贝叶斯公式为:
$$CL= \frac{\int_ \xi L(Data|\theta)\phi(\theta)d\theta}{\int_ \zeta L(Data|\theta)\phi(\theta)d\theta}$$
六、其它置信限
其它置信限还包括仿真置信限等。关于其它置信限的介绍,请关注后续更新。