中国领先的在线旅行服务提供商之一艺龙网于7月11日下午2点至7月12日下午4点出现持续访问故障,根据业内消息,本次问题的症结出在艺龙本身的存储架构上,EMC提供的硬件存储设备也出现了故障。初步估计艺龙网的损失在14.7万元左右,对广大客户也造成不小的影响。
由于艺龙网的存储设备由EMC提供,所以当艺龙CEO崔广福承认服务中断、艺龙与EMC工程师抢修之初,业内都关注EMC的硬件质量问题,认为其导致数据库挂机、系统长时间瘫痪。而之后的研究显示,EMC的硬件设备虽有一定影响,但艺龙本身不完善的备份机制、缺乏备灾方案也难逃干系。
根据技术专业人士的介绍,企业的系统设备架构中应该存在多个层级的备份机制,比如服务器双机热备、存储层灾备、软件层冗余工作等等,这样有利于分散风险。而艺龙的问题就在于其只预备了高性能架构的集群备份,灾备的准备依赖唯一的存储硬件,软件层也缺少冗余准备,所以一旦一个环节出事,整个系统也就难逃厄运。
一位技术人士这样形容艺龙事件:“把所有鸡蛋都放在一个篮子里,篮子出了问题,鸡蛋就全碎了。”
7月14日凌晨,艺龙网再次宣布停运7小时,以便进行系统升级。CEO崔广福也通过微博召集各路技术精英和厂家对艺龙的存储系统献计献策。凸显了高层对于此次事故的重视程度。相信艺龙停机事件对于业内会造成很大反思,促使政府和企业在数据系统的安全与稳定上做好充分准备。
(责任编辑:)