MTBF英文全称是“Mean Time Between Failure”。是衡量一个产品(尤其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品,同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF
随着服务器的广泛应用,对服务器的可靠性提出了更高的要求。所谓“可靠性”,就是产品在规定条件下和规定时间内完成规定功能的能力;反之,产品或其一部分不能或将不能完成规定的功能是出故障。概括地说,产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failure rate),常用λ表示。例如正在运行中的100只硬盘,一年之内出了2次故障,则每个硬盘的故障率为0.02次/年。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间(Mean Time Between Failures),简称MTBF。即:MTBF=1/λ
笔者看到一款可用于服务器的WD Caviar RE2 7200 RPM 硬盘,MTBF 高达 120万小时,保修 5年。120万小时约为137年,并不是说该种硬盘每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬盘的平均年故障率约为0.7%,一年内,平均1000只硬盘有7只会出故障。
下图所示为*的浴盆曲线,左边斜线部分为早期故障率,其故障率一般较高且随着时间推移很快下降。曲线中部为使用寿命期,其故障率一般很低且基本固定。较右部为耗损期,失效率急速升高。电子产品制造商一般通过测试、老炼、筛选等手段将早期故障尽量剔除,然后提供给客户使用。当使用寿命期将尽,产品也即将进入故障高发期,需要报废或更新换代了。
一、MTBF预测法
1、相关标准,目前用于MTBF预计计算的主要标准为MIL-HDBK-217F,对应国内版本为G J B 2 9 9 B。该标准为美军的可靠性预计手册,用于MTBF的预计计算。该标准从95年发布最后一版后不再对其进行更新维护,这本身也反应了标准本身的局限性。
2、预计法的局限性,MIL-HDBK-217F采用了应力分析法和元件计数法分析产品的MTBF。该方法通过元器件的数量以及零件的故障率评估产品的无故障时间。这种方法假设了产品的器件都工作在预期的工作应力下,实际上由于不可预期的因素,产品可能会有瞬间的过应力。另外还有一种情况就是部分对产品寿命有影响的应力难以评估周全。没有充分考虑产品的生产工艺、人为因素对产品可靠性的影响。同时在计算参数的选择上受计算人员对系数的掌握和了解程度影响很大,因此和实际值相比会有很大的差异。
3、基本公式及参数
Failure rate=λp = λb *πE*πQ*πC*πS*πA*πL*πT
λb:零件基础失效率
πE 环境因素Environment factor)
πQ 品质因素:(Quality factor)
πA 应用因素:(Application factor)
πC 复杂性因素:(Quality factor)
πL 累计因素:(Learning factor)
πS 电应力因素:(Electrical Stress factor)
πT 温度因素:(Temperature factor)
这种方法较大的优势是可以在有限的时间里完成对产品MTBF值的较准确预估。
可靠性测试
环境试验是产品环境工程中重要的一环,是确保和判别经过耐环境设计的产品在储存、运输、使用过程中能否达到环境适应性要求的较重要手段,通过环境试验可以分析和验证各种环境因素对产品效能的影响程度及作用机理。
综合类测试是模拟电子产品在运输、存储和使用过程中经受到的综合环境应力及其影响,能更真实地反映电工电子产品在运输和实际使用过程中对温湿度及振动复合环境变化的适应性,暴露产品的缺陷,是新产品研制、样机试验、产品合格鉴定试验全过程必不可少的重要试验手段。
测试项目:
三综合测试 GB/T 2423.35;IEC 60068-2-50;GB/T 2423.36;IEC 60068-2-51;
包装产品ISTA测试 ISTA-1a;ISTA-2a;ISTA-3a;
预计算/MTBF 编辑
设有一个可修复的产品在使用过程中,共计发生过N0次故障,每次故障后经过修复又和新的一样继续投入使用,其工作时间分别为:T0,T1。那么产品的平均故障间隔时间,也就是平均寿命为Q为:(T0+T1)/N0。
通常,我们在产品的手册或包装上能够看到这个MTBF值,如8000小时,2万小时,那么,MTBF的数值是怎样算出来的呢,假设一台电脑的MTBF 为3万小时,是不是把这台电脑连续运行3万小时检测出来的呢?答案是否定的,如果是那样的话,我们有那么多产品要用几十年都检测不完的。其实,关于 MTBF值的计算方法,目前较通用的*性标准是MIL-HDBK-217、GJB/Z299B和Bellcore,分别用于**产品和民用产品。其中,MIL-HDBK-217是由美国*部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于**产品MTBF值计算,GJB/Z299B是我国*标准;而Bellcore是由AT&TBell实验室提出并成为商用电子产品MTBF值计算的行业标准。
MTBF计算中主要考虑的是产品中每个器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,例如,同一产品在不同的环境下,如在实验室和海洋平台上,其可靠性值肯定是不同的;又如一个额定电压为16V的电容在实际电压为25V和5V下的失效率肯定是不同的。所以,在计算可靠性指标时,必须考虑上述多种因素。所有上述这些因素,几乎无法通过人工进行计算,但借助于软件如MTBFcal软件和其庞大的参数库,我们就能够轻松的得出MTBF值。