一种低开销非阻塞的协同式检查点算法
作者:万国伟; 卢宇彤; 谢旻; 沈志宇 国防科技大学计算机学院; 长沙410073
摘要:协同式检查点没置及卷回恢复技术是一种简单有效的容错手段,被广泛地运用于并行/分布式系统中。为进一步降低协同式检查点算法的开销,该文给出了一个基于可重建检查点的非阻塞协同式检查点算法。并行程序出错导致卷回恢复发生的概率远小于检查点设置概率,该算法利用这一特性,将检查点设置的部分开销转至卷回恢复阶段,降低了容错的开销,提高了系统的可扩展性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社