第3期－ 2014年8月

造成存储系统停工的原因

计划外停工(Unplanned Downtime)。由于非预期性的内在或外在因素造成计划外停工，例如停电和系统组件故障。

Quorum [资料来源 : Business Continuity website], 一家美国灾难恢复 (disaster recovery) 产品制造商，对它全球数百个客户进行问卷调查后, 发现造成中小型企业计划外停工的四大原因如下：

停工原因(Downtime Cause)	发生频率(Frequency)
硬件故障(Hardware failure)	55%
人为疏失(Human error)	22%
软件故障(Software failure)	18%
天然灾害(Natural disasters)	5%

计划内停工(Planned Downtime)。为能跟上软件和固件修改、更新的步伐，以及修复无可避免的损耗，系统必须要有用以维护重整的时间。而大部分的系统维修，都需要在离线状态下进行，是以造成计划内停工。

会造成存储系统计划内停工的事件，包括以下的生命周期与维护修理作业(life cycle and maintenance operations)：

生命周期作业(Life Cycle Operations)

重新平衡控制器性能

(Rebalancing controller performance)

添加控制器或硬盘

(Adding controller or disk)

添加控制器硬件

(Adding controller hardware)

升级控制器、存储柜架、交换机

(Upgrade controllers, disk shelves, switches)

维护修理作业(Maintenance Operations)

升级存储软件

(Upgrade storage software)

升级系统、存储交换机、固件

(Upgrade system, disk switch or firmware)

更换故障组件

(Replace failed component)

存储高可用性评估的考量

虽然消除计划外故障停工仍旧是存储高可用解决方案的主要目标，但是计划内维修停工的所需时间也不容忽视，两者都该受到应有的重视 – 对企业而言，停工就是停工，不论原因为何。考量NetApp估算计划内与计划外停工时间的发生比例为 9:1, 任何存储HA解决方案的评估，都应该不仅仅要考虑非预期故障事件的发生频率，也要涵盖如何让排定时间的维修和升级作业，能够在无需系统完全停工的情况下执行。

回到运维康通讯

取消订阅

存储厂商
系统集成商

如何让标准的 SAN 存储蜕变为企业级的 HA 解决方案？

企业 IT 专业

如何完善您的 IT 基础设施以实现无间断业务连续性？

HA-AP
高可用引擎
解决方案彩页

欢迎注册！您只需提供简单的联系信息，即可下载。

联系我们：

info@loxoll.com