我们一般接触到的存储是机械硬盘HDD或固态硬盘SSD,其实还有磁带库、蓝光等海量存储介质,比如Facebook数据中心就采用了蓝光存储。
阿呆最近在SSDFans微信群看到一个华录蓝光存储的PPT,摘录出来分享给读者。
一个DA-BH7010蓝光存储机柜最大容量为1.64PB,机柜的基本结构如下图,上面是6个6U的光盘单元,最底下是电源和控制服务器。
蓝光存储基本结构
看看蓝光存储的基本结构,如下图,左边是光盘匣,右边是光驱阵列,下面是机械手,最后以SAS接口连到服务器,包含了RAID和机械手控制器以及驱动。
上层系统
以各光盘匣为单位进行管理→容量为3.6TB
将光盘匣分为2组(6张碟片为一个单位),送入光驱
光驱系统,6台光驱为一组,使用RAID0/5/6,刻录读取数据
【特点】
以光盘匣为单位进行数据的刻录、读取。
可以保证高传输速度、RAID冗余、离线管理等。
刻录数据较大时,可以使用Reed-Solomon。数据小时,因为在传输速度上没有优势,所以采用方案1的方式,光驱的效率更高。
【优势/不足】
以光盘匣为单位管理数据。使用RAID保护数据。可以进行离线管理。
若要实现设备间的冗余,需要镜像处理,所以系统成本提高。
另一种模式就没有RAID了,光驱分别控制。
上层系统
以各碟片为单位进行管理→容量为300GB
根据需要,将碟片送入光驱
以光驱为单位进行控制、数据的刻录与读取
【特点】
以碟片为单位进行数据的刻录、读取。虽然能够有效的使用光驱,但是传输速度下降。
Reed-Solomon分割的数据,刻录在不同的碟片中。
各碟片放置在不同的机柜中,即使设备本身出现问题,也能正常读取数据。
如果各碟片放置在不同的数据中心,即使一个数据中心出现问题,也不影响数据的正常读取。
【优势/不足】
可以实现设备间冗余,数据中心间冗余。
因为搭载多个光驱,文件大小可以满足多个用户同时访问的要求。
离线管理困难。
最后一种模式是最上层做成NAS、对象存储。
上层系统
以卷为单位进行管理→容量可调
将光盘匣分为2组(6张为一个单位),分割至每个卷使用
采用NAS、Object Storage的刻录读取方式,可以进行文件的访问
【特征】
有NAS、对象存储等接口,与现存系统的连接性高。可以与普通的ISV相连接。
因为以光盘匣为单位进行数据的刻录、读取,可以保证高传输速度、RAID冗余、离线管理等
【优势/不足】
以光盘匣为单位管理数据、使用RAID保护数据、可以进行离线管理。
若要实现设备间的冗余,需要镜像处理,所以将提高系统成本。
Facebook蓝光存储
facebook是世界上最大的图片分享网站
2013年活跃用户的数量达到11.5亿人,每天上传照片数量超过3.5亿张
2015年活跃用户的数量超过15亿人,单日使用量突破10亿人次
facebook保存了数目庞大的照片数据
目前累计上传照片数量超过6000亿张
对于每张照片,facebook存储大小不同的四个版本(在某些场景下只需展示缩略图)
意味着:facebook服务器上存储着2.4万亿张照片
下图是社交网站图片的访问频率随时间的变化趋势,刚上传后访问频率最高,后面逐渐降低,一年后就成了偶尔访问。存储介质也是分级存储,从全闪存、SSD到HDD、光盘。
facebook保存大量图像数据。为了满足实时性要求,在Hadoop系统上保存图像数据。
作为Hadoop发生故障时的候补,在光存储系统上存储Hadoop的备份。
为了提升备份效率,使用Reed Solomon符号在光盘上分散记录。
Facebook最终采用了蓝光光盘作为冷存储介质:
用户照片等数据需要长期保存,现有介质成本高、可靠性低
与硬盘相比整体成本削减50%以上 [成本包括:设备成本、能耗成本、网络成本、机房成本、人员成本、运营成本]
耗电量降低80%以上 [光盘库工作功耗远低于硬盘,且不需要空调冷却系统——光盘库工作能耗为88W,采用外部空气过滤系统替代空调冷却系统]
异地备份方案
在冷存储更新频度低的前提下,地理上分离的多个场所间作数据冗余
以冷数据为对象搭载异地备份(Geo Replication)功能
由于有数据中心间的冗余功能,数据中心内的冗余设备废止(2系统供电、UPS、自备电源、回路2重化、防震构造等),数据中心大幅降低成本,在这个基础上云服务成本大幅降低
facebook已在Prineville的Forest City进行商用,Google已在Spanner上实现
异地备份使可用性和吞吐量性能同时实现
蓝光存储的未来
先看看蓝光存储技术路线图,2023年单盘可以到几TB容量。
未来的光存储技术还有:
全息光存储技术(美国InPhase,日本日立、NHK); InPhace 1.6TB/盘; 日立2TB-8TB/盘
双光束超分辨技术 (澳大利亚 顾敏院士,武汉光电国家实验室)
实验装置水平: 可实现单盘15TB容量
最新实验结果:9nm特征尺寸 理论上可达单盘 1PB
多维技术 (英国南开普敦大学)
开发成功采用纳米晶玱璃的5维光盘,存储寿命可超过亿年,实现永久存储.
In glass 5D: 369TB/disc