EC 编码与性能-成本-可靠性模型

EC 编码与性能-成本-可靠性模型

ℹ️
✋🏻😭✋🏻 本小节编辑中 ✍️✍️✍️

复制与数据安全性模型

故障域:多个篮子不能放在同一辆车上

[图:数据复制和 mttr]

然而单纯地多份复制不一定奏效,考虑同一个机房的同一个机架。

因此,大型分布式存储系统需要根据基础设施的实际情况,对存储机器所在位置建模,在副本放置策略上,尽量避开一损俱损。

在 Google 关于 GFS 的故障研究论文中[^GFS_fault],描述了其使用以下的故障建模。

值得指出的是,这种等级划分和实际基建的拓扑有关,比如有的云厂商提供的可用区(AZ)概念。

复制组数量与可用性

复制组不可用导致的写倾斜

编码、成本与性能模型

冗余度与信息论

副本

EC 编码

LRC 编码

数据安全性模型

平均磁盘年故障率

集群修复速度

编码与数据安全

动手做:为用户制定合适的编码策略

小结