深圳市讯科标准技术服务有限公司
比如:MTBF中的故障数可以近似理解为Outage,系统重启属于Total Outage, 模块Crash属于Partial Outage
MTBF测试报告提升可靠性都是需要降低故障数减小downtime
在系统和应用设计中都需考虑如何减少错误,或者出现错误如何恢复。
终端上的一些后台服务可以近似理解为服务端应用,虽然不能完全照搬上文中提到容灾和恢复的场景,但是可以借鉴其中的一些思路。
终端上可以通过参考DPM的概念增加数据衡量指标,但可能不需要也不现实每个场景都执行100万次操作,可以依据实际情况调整标准要求
可以参考Failover策略中错误探测,隔离,恢复的操作在出现错误时及时发现,恢复重新启动来减少对用户造成的负面影响,恢复时间即Failover Recovery Time就成了一个关键指标
寿命试验是可靠性试验中****基本的项目之一,它是将产品放在特定的试验条件下考察其失效(损坏)随时间变化规律。通过寿命试验,可以了解产品的寿命特征、失效规律、失效率、平均寿命以及在寿命试验过程中可能出现的各种失效模式。
寿命试验(MTBF)方法分为定时截尾试验,定数截尾试验,估算方法为:平均寿命的点估计值、单侧置信下限估计、双侧区间估计。
-/gbafibd/-