Skip to content

存储技术

浅谈RAID写惩罚(Write Penalty)与IOPS计算

通常在讨论不同RAID保护类型的性能的时候,结论都会是RAID-1提供比较好的读写性能,RAID-5读性能不错,但是写入性能就不如RAID-1,RAID-6保护级别更高,但写性能相对更加差,RAID10是提供最好的性能和数据保护,不过成本最高等等。其实决定这些性能考虑的因素很简单,它就是RAID Write Penalty(写惩罚)。
存储方案规划的过程中,最基本的考虑因素有两个,性能和容量。性能上的计算看可以分为IOPS和带宽需求。计算IOPS,抛开存储阵列的缓存和前端口不谈。计算后端物理磁盘的IOPS不能简单的把物理磁盘的最大IOPS相加而获得。原因是,对于不同的RAID级别,为了保证当有物理磁盘损坏的情况下可以恢复数据,数据写入的过程中都需要有一些特别的计算。比如对于RAID-5,条带上的任意磁盘上的数据改变,都会重新计算校验位。一个7+1的RAID-5的条带中,七个磁盘存储数据,最后一个磁盘存储校验位。

对于一个数据的写入,假设在第五个磁盘上写入的数据为1111,如下所示。那么整个RAID-5需要完成写入的过程分为以下几步:

1.读取原数据0110,然后与新的数据1111做XOR操作: 0110 XOR 1111 = 1001
2.读取原有的校验位0010
3.用第一步算出的数值与原校验位再做一次XOR操作: 0010 XOR 1001 = 1011
4.然后将1111新数据写入到数据磁盘,将第三步计算出来的新的校验位写入校验盘。
由上述几个步骤可见,对于任何一次写入,在存储端,需要分别进行两次读+两次写,所以说RAID-5的Write Penalty的值是4。

不同RAID级别的Write Penalty:
RAID-0:直接的条带,数据每次写入对应物理磁盘上的一次写入
RAID-1和10:RAID-1 和RAID-10的写惩罚很简单理解,因为数据的镜像存在的,所以一次写入会有两次。
RAID-5:RAID-5由于要计算校验位的机制存在,需要读数据、读校验位、写数据、写校验位四个步骤,所以RAID-5的写惩罚值是4。
RAID-6:RAID-6由于有两个校验位的存在,与RAID-5相比,需要读取两次校验位和写入两次校验位,所以RAID-6的写惩罚值是6。
计算IOPS:
根据上文的描述,在实际存储方案设计的过程中,计算实际可用IOPS的过程中必须纳入RAID的写惩罚计算。计算的公式如下:
物理磁盘总的IOPS = 物理磁盘的IOPS × 磁盘数目
可用的IOPS = (物理磁盘总的IOPS × 写百分比 ÷ RAID写惩罚) + (物理磁盘总的IOPS × 读百分比)
假设组成RAID-5的物理磁盘总共可以提供500 IOPS,使用该存储的应用程序读写比例是50%/50%,那么对于前端主机而言,实际可用的IOPS是:
(500 ×50% ÷ 4)+ ( 500 * 50%) = 312.5 IOPS

参考: EMC中文技术社区(https://community.emc.com/go/chinese)

关于光纤链路的排障

碰到过不少因为光纤链路的问题导致oracle rac集群故障,所以把一些这方面的排障思路方向汇一下,任何做过这方面排障的工程师都清楚这是一个比较繁冗的过程,因此知道从什么地方入手寻找故障非常重要。这里给出了一些最常见的光纤故障以及产生这些故障的可能因素,这些信息将有助于用户对网络故障进行有根据的猜测。
    
1.光纤断裂通常是由于外力物理挤压或过度弯折;
2.传输功率不足;
3.光纤铺设距离过长可能造成信号丢失;
4.连接器受损可能造成信号丢失;
5.光纤接头和连接器(connectors)故障可能造成信号丢失;
6.使用过多的光纤接头和连接器可能造成信号丢失;
7.光纤配线盘(patch panel)或熔接盘(splice tra)连接处故障。
8.通常而言,如果连接完全不通,那么很可能是光纤断裂。但如果连接时断时续,可能有以下原因:
9.结合处制作水平低劣或结合次数过多造成光纤衰减严重;
10.由于灰尘、指纹、擦伤、湿度等因素损伤了连接器;
11.传输功率过低;
12.在配线间连接器错误。

一般在碰到集群相关心跳出问题时候,在诊断光纤方面,应该尽量了解客户现场的案发时候的情形,比如是否动过光纤线?热拔插过否?有没有更换或者挪动等,也尽量去把每一方面涉及到的处理摸清技术手段搞清楚,以便在排障时候提升效率