在fault tolerance中有两种方法进行故障恢复,error handling(错误处理)和fault handling(故障处理),前者消除出现的错误但不能根除故障(fault)的根源,后者旨在去除fault。
1)Error handling:
有两种方案,分别是checkpoint and repair 和masking。checkpoing and repair是让系统定期地进行状态保存,记录在checkpoint中,当检测出错误时,利用记录的checkpoint回滚(rollback)到之前正确的系统状态(system state)。masking,中文是掩蔽的意思,当一个组件出错时,用这个组件的冗余组件(redundant component)进行替换。
2)Fault handling:通过隔离(isolate)故障组件(faulty component)恢复系统并消除故障(fault)。一个常见的例子是虚拟内存系统,每个进程在不同的地址空间中运行,不能相互干扰,如一个进程中未初始化的指针不会乱指到另一个进程的地址空间,给另一个进程的执行造成错误,但是这对于内核级(kernel-level)的进程却无能为力,因为内核自己在管理虚拟内存系统,因此当内核级的进程出现错误时(假设因为辐射和低电压造成了指针乱指),会使整个系统崩溃。
分享到:
相关推荐
STM32出现HardFault故障的解决方法
STM32出现HardFault故障的解决方法.pdf
3、故障树分析基本概念(Fault Tree Analysis-Basic Concepts) 4、故障树基本元素(The Basic Elements of a Fault Tree) 5、建立故障树基础(Fault Tree Construction Fundamentals) 6、概率定理-事件的数学描述...
实现配电网故障恢复和故障重构算法,文件算例是IEEE33节点系统。 Realize the distribution network fault recovery and fault reconstruction algorithm. The file example is the ieee33 node system
详细分析STM32的fault故障的原因,分析非常详细。
python程序,基于故障诊断的python程序,供故障诊断学者下载学习
Faultcode故障代码[参照].pdf
Faultcode故障代码
svm python 实现对故障信号的分类处理
故障诊断经典Fault-Diagnosis Systems Isermann
一个2机网络,接入电力系统稳定器,采用时域仿真的方法,用于研究故障后系统频率、电压的波动与恢复过程
故障检测主函数吗,主要是故障的检测还有判断,希望对读者有所帮助
创建Horizon Fault 恢复模型
一个简单的故障检测程序,采用了fisheer方法,简单易懂,适合初学者。
故障诊断相关的MATLAB代码,主要有神经网络算法的m文件
使用PCA算法进行基于数据的故障诊断的程序
故障树分析Fault Tree Analysis
该文件包括了故障诊断数据集,matlab代码,可供参考学习
电动机轴承外圈故障数据,方便大家做仿真。
指定频域鲁棒h-inf故障检测,文章,具有较好的实验效果。