|
第30期 - 2017年2月 国内某商品交易中心 – 贰之二 前期提要
高可用需求。系统的高可用性需要从应用、主机、网络与存储多个层面综合保障。在一个完整的高可用解决方案中,除了通过全冗余 FC 交换机配置保障链路和网络层的可用性,并通过主机集群软件和虚拟主机技术保障业务层的可用性及连续性外;还必须要赋予存储同等级的高可用功能,以形成主机、网络与存储间头尾连接的全冗余配置。 答案 : HA-AP HA SAN 高可用存储架构
项目团队初步选定考虑 Loxoll 的 HA-AP 高可用存储网关与 EMC VPLEX、IBM SVC 解决方案。之后经过深入对比,发现三者虽然都是以数据镜像作为实现存储高可用的基础,但是 HA-AP 与其余二者却采用了截然不同的设计和技术原理 :
1.
设备形态 : VPLEX/SVC 的设计都是虚拟化存储网关,必须把存储原始的 LUN 打上 “ 标签 ” ,或者重新封装后映射给主机,所以主机看到的 LUN 不是原始的 LUN;如果网关坏掉,LUN 就无法使用。HA-AP 设计为非虚拟化 Router 网关,不改变存储原始 LUN 上的任何信息,HA-AP 如撤掉之后,存储原始的 LUN 可直接映射给主机,保持可用。
2.
设备结构 : VPLEX/SVC 都是基于 Linux 的集群系统,采用 x 86 PC 硬件结构,配置多核处理器、大量高速缓存及 8GB/sec HBAs。其系统结构非常复杂,并且需要专门的管理服务器,以及置放系统配置信息的元数据卷;因此有建设周期长、安装配置任务繁多、维护程序复杂,以及稳定性和安全性等方面的顾虑。而 HA-AP 是基于嵌入式操作系统,采用工业级模块化结构的单一目的硬件,完全可以避免前述的种种顾虑。
3.
数据同步 : VPLEX/SVC 由于是虚拟化技术,需要高频的 CPU 以及大容量缓存,以进行数据的写缓存同步处理;其最重要的技术环节是,如何保证在任一时间点所有引擎的缓存数据一致, 否则在发生故障切换的时候非常容易造成数据不一致。HA-AP 是解析 SCSI3 命令后,通过数据分流和转址实现 LUN 的同步;其引擎的缓存只做 “ 队列 ” 排队,不做 “ 写缓存 ”,故而引擎与引擎之间无需做缓存同步,所以也没有缓存失败破坏数据完整性的顾虑。
4.
故障切换 : 由于 VPLEX/SVC 是 Linux 集群,其故障切换的机制需要诸多判断条件,故而时间会比较长,通常在 30-40 秒以上,而这种情形多半会造成对应用层的影响。HA-AP 则无论是在存储宕机、链路断掉,或引擎宕机等故障情况下,其故障切换实质上就只是路径的切换,因此可实现 0 秒切换。
根据以上分析结果,技术团队给予 HA-AP 高可用存储网关高度肯定,并定案其系统架构如下 :
⋅ 后端两台 EMC VNX5150 存储阵列 |
|