蓝光存储在数据中心的应用

2018-05-26 admin_ykcx 504

我们一般接触到的存储是机械硬盘HDD或固态硬盘SSD,其实还有磁带库、蓝光等海量存储介质,比如Facebook数据中心就采用了蓝光存储。

阿呆最近在SSDFans微信群看到一个华录蓝光存储的PPT,摘录出来分享给读者。

image

一个DA-BH7010蓝光存储机柜最大容量为1.64PB,机柜的基本结构如下图,上面是6个6U的光盘单元,最底下是电源和控制服务器。

image

蓝光存储基本结构

看看蓝光存储的基本结构,如下图,左边是光盘匣,右边是光驱阵列,下面是机械手,最后以SAS接口连到服务器,包含了RAID和机械手控制器以及驱动。

image

上层系统

  • 以各光盘匣为单位进行管理→容量为3.6TB

  • 将光盘匣分为2组(6张碟片为一个单位),送入光驱

  • 光驱系统,6台光驱为一组,使用RAID0/5/6,刻录读取数据

【特点】

  • 以光盘匣为单位进行数据的刻录、读取。

  • 可以保证高传输速度、RAID冗余、离线管理等。

  • 刻录数据较大时,可以使用Reed-Solomon。数据小时,因为在传输速度上没有优势,所以采用方案1的方式,光驱的效率更高。

【优势/不足】

  • 以光盘匣为单位管理数据。使用RAID保护数据。可以进行离线管理。

  • 若要实现设备间的冗余,需要镜像处理,所以系统成本提高。

image

另一种模式就没有RAID了,光驱分别控制。

image

上层系统

  • 以各碟片为单位进行管理→容量为300GB

  • 根据需要,将碟片送入光驱

  • 以光驱为单位进行控制、数据的刻录与读取

【特点】

  • 以碟片为单位进行数据的刻录、读取。虽然能够有效的使用光驱,但是传输速度下降。

  • Reed-Solomon分割的数据,刻录在不同的碟片中。

  • 各碟片放置在不同的机柜中,即使设备本身出现问题,也能正常读取数据。

  • 如果各碟片放置在不同的数据中心,即使一个数据中心出现问题,也不影响数据的正常读取。

【优势/不足】

  • 可以实现设备间冗余,数据中心间冗余。

  • 因为搭载多个光驱,文件大小可以满足多个用户同时访问的要求。

  • 离线管理困难。

最后一种模式是最上层做成NAS、对象存储。

image

上层系统

  • 以卷为单位进行管理→容量可调

  • 将光盘匣分为2组(6张为一个单位),分割至每个卷使用

  • 采用NAS、Object Storage的刻录读取方式,可以进行文件的访问

【特征】

  • 有NAS、对象存储等接口,与现存系统的连接性高。可以与普通的ISV相连接。

  • 因为以光盘匣为单位进行数据的刻录、读取,可以保证高传输速度、RAID冗余、离线管理等

【优势/不足】

  • 以光盘匣为单位管理数据、使用RAID保护数据、可以进行离线管理。

  • 若要实现设备间的冗余,需要镜像处理,所以将提高系统成本。

Facebook蓝光存储

facebook是世界上最大的图片分享网站

  • 2013年活跃用户的数量达到11.5亿人,每天上传照片数量超过3.5亿张

  • 2015年活跃用户的数量超过15亿人,单日使用量突破10亿人次

facebook保存了数目庞大的照片数据

  • 目前累计上传照片数量超过6000亿张

  • 对于每张照片,facebook存储大小不同的四个版本(在某些场景下只需展示缩略图)

  • 意味着:facebook服务器上存储着2.4万亿张照片

image

下图是社交网站图片的访问频率随时间的变化趋势,刚上传后访问频率最高,后面逐渐降低,一年后就成了偶尔访问。存储介质也是分级存储,从全闪存、SSD到HDD、光盘。

image

  • facebook保存大量图像数据。为了满足实时性要求,在Hadoop系统上保存图像数据。

  • 作为Hadoop发生故障时的候补,在光存储系统上存储Hadoop的备份。

  • 为了提升备份效率,使用Reed Solomon符号在光盘上分散记录。

image

Facebook最终采用了蓝光光盘作为冷存储介质:

  • 用户照片等数据需要长期保存,现有介质成本高、可靠性低

  • 与硬盘相比整体成本削减50%以上 [成本包括:设备成本、能耗成本、网络成本、机房成本、人员成本、运营成本]

  • 耗电量降低80%以上 [光盘库工作功耗远低于硬盘,且不需要空调冷却系统——光盘库工作能耗为88W,采用外部空气过滤系统替代空调冷却系统]

image

异地备份方案

  • 在冷存储更新频度低的前提下,地理上分离的多个场所间作数据冗余

  • 以冷数据为对象搭载异地备份(Geo Replication)功能

  • 由于有数据中心间的冗余功能,数据中心内的冗余设备废止(2系统供电、UPS、自备电源、回路2重化、防震构造等),数据中心大幅降低成本,在这个基础上云服务成本大幅降低

  • facebook已在Prineville的Forest City进行商用,Google已在Spanner上实现

  • 异地备份使可用性和吞吐量性能同时实现

image

蓝光存储的未来

先看看蓝光存储技术路线图,2023年单盘可以到几TB容量。

image

未来的光存储技术还有:

全息光存储技术(美国InPhase,日本日立、NHK); InPhace 1.6TB/盘; 日立2TB-8TB/盘

双光束超分辨技术 (澳大利亚 顾敏院士,武汉光电国家实验室)

  • 实验装置水平: 可实现单盘15TB容量

  • 最新实验结果:9nm特征尺寸 理论上可达单盘 1PB

多维技术 (英国南开普敦大学)

  • 开发成功采用纳米晶玱璃的5维光盘,存储寿命可超过亿年,实现永久存储.

  • In glass 5D: 369TB/disc