IT部门习惯于支付固定的IT资源费用。但是扣款的方式和私有云的快速变化都带来了新变化。
乍看之下,私有云似乎是IT的下一个增长点。但是,这一模式对于采用老办法管理基础设施的组织又真正意味着什么呢?他们是否能够在一夜之间将服务器虚拟化迁往私有云?通常来说,答案都是否定的。
对于具有支付固定IT资源费用历史的IT部门来说,即用即付的私有云计算消费模式会造成严重的焦虑。私有云基于扣款的计费模式就像是每个月寄来的电话账单,如果没有合适的工具来跟踪这一资源消费的新方法,其变化的费用会使得IT人员无所适从。此外,业务经理可能会反对这个必须为IT使用而支付费用的新系统。他们可能会问,“为什么我们要为以前是‘免费’的服务器支付费用?”
现在,考虑到基础设施资源的复杂性(其中包括硬件、存储设备、网络设备),所有的资源都进行了虚拟化和集成。如果公司的任一成员能够随意地启动虚拟服务器,为虚拟机(VM)所消费的服务和能源支付费用就变得相当复杂。这与记录和跟踪快速变化的云计算环境不同。正如一位IT经理所注意到的,在这个新虚拟世界中扣款,“其直观性和可控性何在?”
因此,实现私有云的特点——可扩展性、弹性、可度量服务、广泛的网络接入以及自我服务模式——涉及了众多的矛盾:IT资源更具弹性、动态和灵活性。但是构成私有云模式基础的IT系统需要具有比之前更高的透明度、更好的定义和更好的管理。
为了在动态私有云环境中达到直观性和透明度,你必须从一开始就有所区别地考虑如何管理和控制你的基础设施。
系统规划与设计
多年来,IT部门一直都在强调规划的好处,但是有了私有云基础设施,设计也同样成为了需求。与具有看似无穷无尽资源的公共云不同,私有云是基于有限资源的,企业IT部门要尽力管理性能与能力。私有云仍还需要由IT人员获得、安装和管理的底层服务器、网络和存储设备。虽然云通常有一些产能过剩,但是如果项目需求超过其可用资源时,老式IT可能需要几周或几个月的时间来获得更多的在线资源。
一个良好的规划过程和文档文化将有助于组织在现有系统上获得更好的效益,让IT人员提前做好性能规划可避免过度采购、可适当地监视资源和避免虚拟机肆意无序增长。
系统设计阶段是产生在云计算环境中使用高级可用功能的关键时间。例如,VMware的虚拟化和管理套件vSphere就实现了高可用性、容错性和业务连续性,这些特点可或正面或负面地影响系统设计、资源消耗,甚至一个应用的价格。参与私有云系统设计的人员都必须知道可能的前因以防令人意外的后果。
附:简化规划和设计的方法
当你开始建立私有云时,有各种不同的方法可简化与规划设计阶段相同的问题。
1 每个资源或IT的部门都并记录在案,其中包括网络、存储和虚拟化群体。
2 IT部门的所有成员均应在事前达成共识,即IT应当支持什么。例如,使用微软群集服务的设计可能无法使用VMware公司的vMotion,这就可能从根本上影响IT如何支持这些服务和基础设施。
3 云计算的设计者们应到知道他们可以使用哪些资源,这样他们能够及时地安装额外的资源。为了帮助这个过程,项目经理应当让IT人员尽可能早地意识到他们的资源需求。
4 应用技术人员应参加设计会议时,不应仅仅只有一个物理设计而且还应对他们所需完成的项目有一个完整的概念。这将有助于了解需要多少RAM和CPU资源,但是了解应用程序必须满足特定性能参数也是至关重要的。
5 IT经理应到对群集选项和业务连续性需求保持一个开放的心态。一个建议的群集可能性能更好或使用许可证成本更低,例如使用更多的双核虚拟服务器以替代更少的四核虚拟服务器。也许,可以通过使用已到位的方法在虚拟机或存储级别处理业务连续性问题,而不是在应用程序内部。
服务水平协议
虽然服务水平协议(SLA)是公共云中最经常讨论的话题,它在私有云中也是不可忽视的一部分。这些SLA不太涉及服务问题的处罚,而是更多地涉及业务开展的正式文档记录需求。
所以,在数据中心基础设施设计之后,下一步就是记录环境性能和可用性需求并开发一个耐用的SLA。当然,这个任务知易行难。在云计算中,服务水平协议是特别棘手的,因为它是很难度量将收到工作量的服务水平。
是否可通过所使用资源或工作时间来度量服务水平呢?那么是否可以根据传统的CPU和内存指标来度量,或以网络和存储数字来度量呢?私有云并不特别关注获得最高性能,它更关注根据任务获得合适的性能。所以,当发生故障时,确定需求为何、如何进行度量以及该采取哪些措施才是建立SLA的关键内容。提前提出这些需求可避免发生故障时的误解和互相指责。如果一切情况都已提前做好预案,事件响应也可以实现自动化,从而减少停用时间。
如果撰写SLA反映业务需求听起来令人生畏,部分解决方案可能是把重点放在服务和工作负载本身,¬让IT人员来确定如何最好地满足那些需求。这对于灾难恢复可用性需求来说特别适用。有出色的虚拟机和存储级选项,用于保护IT能够自我管理的服务。成功的SLA也可以指定可用性、性能以及性能方面的可用性。如果交付性能无法完成工作,那么99.99%的可用性也是远远不够的。
(责任编辑:安博涛)