ITValue社区

中化的云计算故事

作者:彭劲松|文 / 日期:2011-06-13

中国中化集团(以下简称“中化”)是一个有60年历史的国企,2009年的收入是3千多亿人民币,横跨五个行业,全部都是主业。它的业务遍及海内外,在世界和国内都有营销网络和业务运行平台,有上市公司一些监管和治理的要求。

在“十一五”之前中化就确定下来“五统一”的信息化建设策略,将中化在全球所有的信息系统应用平台集中统一管理和建设,包括所有银行、证券、交易公司等等这些外围系统,无论对内还是对外全部建成一个集中统一的应用平台。

基于这个平台,到2008年底2009年初,中化的法人单位达到200多个,93%的企业已经全部通过ERP进行管控。管控不是简单的财务财务,而是三个组成部分:一是在流程当中进行管控;二是财务管控;三是风险管控。

通过多年的建设,在当时应用的不是现在的系统平台,但是我们也知道,现在的商业也好、经济环境也好是日新月异,都是在不断变化的。如果我们用很多年前的ERP系统支撑现代的商业模式,很明显有一个很大的问题,如何支持业务的变化,如何支持业务的发展,更主要的是如何进行业务的创新,这是很大的问题。2008年我们集团的信息领导小组确定下来,把过去4.7版本升到ECC6,通过这种版本升级带来更多的商业软件,这些软件里面都有很多的商业思想在其中,从而为企业的业务创新提供一个很好的手段。

在这里不讲升级的过程,只是诠释一下升级是按照一定的阶段来做的,有一个方法论。前面已经做了介绍了,所有的系统支撑着整个的商业运作,是不可停滞的,而且是离不开的。所有的升级是在同步进行发展,这就会带来很大的挑战。我们不说其他的跟业务进行协调等等,到今天首先有一点大家都是专家也都知道,就是资源上的调整,我们需要大量的资源,同时支撑这一时间需要超量规模资源的需求如何进行满足。刚才我们看到了前面有方法论,我们自然是按照一个科学的方法进行计划、布局和策略制定,这一切到此为止都非常顺利。

2008年全球金融危机,无论企业也好,国家也好,都会同样存在一个问题,2009年我们怎么面对?对于我们IT工作者来说,我们已经制定的这些升级计划怎么办?无论是内在还是外在的需求都不允许我们打退堂鼓。我们要有跟常规不一样的思考,对于前面的这些布局都要进行重新的定义。

2008年2月份我们成立了一个小组专门研究云计算,到8月份基本上了解到它能够带来的一些效益,尤其对它可能带来的一些风险进行了很好的控制和评估。所以我们在做2009年计划的时候,确定下来就要用这种创新的方法来重新定义我们的系统升级,要在云计算上实现我们要完成的工作。

现在这个系统支撑了中化3千亿的收入,95%以上的核心应用全部都在这个集中的系统当中,我们机房面积400平方米,在京郊还有一个70平米的备份数据中心,里面还有辅助的东西,包括UPS、空调还有监控的面积。在所有都不允许的情况下,我们没有机会再去扩充,也没有机会增加任何设备,所有故事的发生就是在这个470平米当中发生的。
云计算所关心的要建立一个动态资源池,统一的管理。云的核心实际上就是云控制器,可以很好的进行动态分配。比如现在要布置一个开发系统,云控制器来进行分配去哪个资源的空间进行调整。接着假设再做测试系统,当这一部分不够的情况下,又会另外找一个地方再补充。所有的资源都按照你的需求和服务进行匹配,从而满足你的要求。还有一种状况,我们叫做服务器故障。这个云是如何应对的?它所有的服务会动态的调整到另外一个资源池里,所以所有服务在一个资源池的情况下完全可以扩充,按照需求服务进行匹配,而且在一个网络环境下进行。用户根本就不会感知,或者不需要了解这个服务是在哪一台物理机上发生的,所有的由云进行,并且资源可回收,为下一次云的需求而提供资源。

技术已经完全脱离了物理的概念,全部在一个云中,管理、资源调配、提供的服务和为了满足需求的一些设计,全部都在云里进行,极大的缩短了IT交付时间,为商业提供服务。

我有三点体会:

第一,做云计算一定要有需求上的考虑,没有需求为什么要上?一定要有应用的需求。在座有我们的同行,我们也都知道,有很多应用,像炼化这种企业,很多MES系统,那也是IT的一部分,这种应用就不适合做云计算,所有这些东西需要去分析和思考。

第二,需要有步骤。我们做出的决定绝不是拍脑袋,有步骤的进行所有应用的实施,做服务统一,进行集中的工作。2005年就在11台机器上承载了公司2千亿业务,所有的ERP系统装在这台机器上,不通过虚拟化是不可能完成的。2007年我们又实现了SOA。但是面向服务不是你的硬件或者程序,而是要提高到服务这个层次,这些融合才是云计算的基础,所以才构成了我们2009年成功的实施了云计算。

第三,就是安全。我在这里要说的是,什么事情都有安全的问题,尤其是IT行业。中化全球都用一个单域部署的平台,却没有发生安全威胁事件,在于有一个安全体系的支撑。

最后给大家讲一个小故事,我也是国际注册信息系统设计师,很关心安全问题。一个机房按理说它的管理是非常固化的东西,换了一个人,过来以后告诉领导要换这个换那个,换了很多东西,把每天的巡检制度撤了,把规章制度撤了,每天的记录也撤了,最主要的把检查的巡视员也撤了。这个机房之前10年没有发生事故,撤完以后,5个月之后全部停了,影响工作6个小时。实际上查出来问题很简单,北京1月份到6月份春天有很多柳絮,按原来的规则是一年换5次控制滤芯罩,春天两次,一个季度一次,整个花下来600块钱全解决了。解决这个人说没有什么测试系统,就是这些探头,花了30多万都装了很多探头,最后好像解决了,接着又过半年又出事了,电源全断了,有一天加班,又花了几十万,请了一个外包,把机房的监控给外包出去了,说现在全世界都做外包,我们也要做外包。结果外包的这个人正好有一天加班,他走了,换了一个公司其他人,没有经过任何培训,结果他关灯把总电源全关了,这样就出事了。出事了以后又找问题,如果找对了问题也可以,结果问题就是这个负责的经理说我不让你加班,你为什么要加班?这是哪儿跟哪儿?所以这是体系的问题,技术没有百分之百的,我们必须来弥补,才能降低我们的风险。安全在很多时候,尤其是云计算讨论的最为热闹的时候,我认为不是阻碍我们使用云计算一个根本的因素。只要我们体系上是健全的,云计算仍然对于一个企业是安全的。公共云我不好说,但是对于私有云,因为是在网络边际以内,我觉得完全可以通过体系进行管控。

(本文作者为资深云实践专家。本文由ITValue韩洋根据其在第三届云计算大会“云计算与信息化创新”分论坛的演讲整理而成,未经本人确认。)

延伸阅读

推荐阅读

共有10位社区会员对该文章有贡献:

  • 刘湘明 《商业价值》杂志出版人、ITValue发起理事
  • 朱明生 万达酒店管理公司信息部总经理
  • 杜建成 江苏道吉面料有限公司IT总监
  • 陈其伟 独立CIO、ITValue发起理事
  • 尚文
  • 李亢
  • 周应
  • 黎伟东
  • 赵建凯
  • 茅晓栋 杭州柏年光电标饰有限公司 资讯总监

该知识文章由以下社区讨论提炼而成:

ITValue社区