LSI存储专家Luca Bert剖析:RAID 6 探秘
作者: 来源: 添加日期:2009-5-13 15:51:49
过去几年来,RAID 6不断推广,已成为购买RAID控制器时必须考虑的一项特性。本文将探讨人们对该技术兴趣不断提高背后的一些原因,说明有的原因是合理的,而有的则是盲信,并将给出具体模型与实施实例,分别说明其优缺点,为分析问题、明确解决方案奠定坚实的基础。
从最基本的角度来说,RAID就是指一组磁盘关联和相对应的数据布局,在某些组件发生读取错误的情况下仍能确保从系统检索到数据。RAID 0是基础条带化模型,不支持任何冗余,因此可最优化系统性能,但在数据故障情况下不能恢复数据。RAID 5 设计旨在从单次数据故障中恢复数据,通过添加一个冗余校验盘(“P”盘即奇偶校验盘),作为对等数据 XOR 计算,从而实现数据恢复功能。从数学角度来说,我们把数据恢复可看作只有一个未知变量(也就是因读取故障丢失的数据)的线性方程式,并能通过基础代数方法轻松解出任何线性方程。
RAID 6扩展了RAID 5的功能,可在同一数据集上恢复两个数据错误。从数学角度来说,RAID 5使用一个方程式解出一个未知变量,而RAID 6则能通过两个独立的线性方程构成方程组,从而恢复两个未知数据。第一个方程与 RAID 5机制一样,也是通过添加P盘实现的,而第二个方程则有所不同,将创建一个 盘,因此 RAID 6又称作“P+Q”盘机制。
从理论上说,这种回归计算可以无限延伸,可创建任意类型的M+N冗余,但实际应用通常仅限于N=2,也就是说数据条带上同时发生两个不同的故障,这也就是RAID 6所要解决的主要问题。
为什么需要RAID 6?
RAID 5可独立解决磁盘不能检索数据的两种情况:
一个磁盘损坏,也就是说不能对任何读写命令做出响应,需要更换。RAID 5能从保存的对等数据中恢复所有数据,重建缺陷磁盘。
磁盘组本身没问题,但其中一个磁盘上出现了坏块(即不能读取的块),造成某些数据不能恢复。 |