马云说,“我们现在正从IT(信息科技Information Technology)时代走向DT(数据科技Data Technology)时代。”数据将影响我们生活的方方面面,企业的IT运维也不例外。“过去传统运维的模式没有太多的检测手段、工具和平台。仅依靠管理者、领导的责任心,工程师技术和技能来做运维,但已远不能应对当前绿色环保、安全高效节能的新要求。中兴力维凭借22年的动环、视频维护经验,结合云计算、物联网、大数据、深度学习,推出了适用于一般政企、商业连锁市场的力维云服务,将被动运维变主动运维,帮助企业实现高效运营。” 5月9日中兴力维副总裁曾涛接受企业网D1net记者专访时这样表示。
变革正悄然发生
“1995年时我们还是中兴通讯下面的一条产品线,为中兴通讯的基站做配套产品,我们的客户群体主要是运营商。在跟客户沟通过程中,我们发现机房运维缺乏完善的制度,全凭工程师能力、领导的责任心,繁琐的工作没有记录更不用说是日志,管理层无法预测运维的效果,以用户报修为驱动运维的日常工作。随后运营商对运维提出了更高的要求。”曾涛回想起中兴力维在云运维这条路上的经历时感受良多。
图:中兴力维副总裁曾涛
“运营商希望进一步降低运维成本,提高运维效率,加快对突发事故的处理能力,以及对设备运行状态实时监测,并能对设备故障进行预判。在这些方面,运营商可以说是走在了市场的前面。”
“不仅如此,我们发现中小企业的机房维护同样面临着人员不足,人员水平提升跟不上日趋复杂的网络,网络设备类型多,运维工具繁杂,配置细节难以兼顾,人力资源利用率低等问题。”
“我们希望用一种新的思维解决运维中的这些问题。”曾涛继续介绍,“随着物联网时代的迅速发展、4G通信技术和社交生态网络的不断成熟,从滴滴的共享平台到摩拜单车的共享租赁,共享经济已经成为社会发展的重要趋势。基于共享理念,通过运用最新的物联网、大数据、云计算、共享等技术,结合中兴力维在动力环境和视频监控领域这么多年的经验和技术积累,以及1000多名工程维护人员的资源优势,我们最新推出了一站式智能化运维托管平台‘力维云’服务。希望通过提供移动监控、智能值守和线下维护等一站式全方位的服务,为客户提供更低成本、高品质的运营服务。”
“力维云”运维运营中心
运维:变被动为主动
“与传统的运维服务相比,力维云的运维服务实现主动服务、快速部署、云共享这三大转变。” 中兴力维CTO曹友盛博士对记者这样表示。
图:中兴力维CTO曹友盛博士
首先是主动服务,力维云的运维服务以各种监控、告警、日志、报告等服务工具为依托,通过全面的云监控可以及早发现故障隐患,从而可以建立起主动式运维。其次,由于力维云是一个云运维共享平台,每当新增一个服务单元时,只需要在网络上增加一个物联网网关,就可以监控管理整个新增加的系统,整个过程简单、高效。最后,通过力维云的云共享概念和云框架,有效地降低了运维成本。同时把数据乃至应用程序全部集中到云端,这意味着大量在本地的运维工作转移到云服务器端,运维的总体工作量大大减少,运维成本也就大幅降低。
“这也形成了力维云的四大优势:第一是领先行业的运维体系,24小时Call Center、远程监控系统、移动调度系统和专业的设备体系,能够为客户提供主动的线上线下运维服务;其次是深度的数据分析、预警能力,采用大数据分析技术、物联网技术、云计算技术、移动平台技术,能够有效实现告警、报警,消除故障隐患;同时具有更广泛的场景适应性,无论是分散的中小场景监控、动环视频一体化展示或移动互联网的应用需求,力维云服务系统都可以满足;最后是我们拥有专业的运维人员覆盖全球,经过专业培训和严格考核覆盖全球的超过1000人的运维团队,并且数量还在持续增长。”曹博士总结道。
数据驱动的运维
大数据的基础是物联网。“赋予云运维新的认知,中兴力维首次在业界明确提出了力维云运维是基于物联网、共享平台、大数据上的云运维平台。”曹友盛这样表示。
力维云的整体架构
“力维云的本质就是物联网。”曹博士进一步解释道:“通过传感器对环境的感知、对配电设备、空调、蓄电池、门禁、IPC等设备的监测,将数据汇聚到物联网网关;以及通过基于P2P技术的视频平台建立起安防系统;通过物联网运营支撑系统OSS建立起对工程维护人员、客户提供的实时统一的配置、管理、维护服务平台,通过物联网将人与人、人与物、物与物连接起来实现了数据化的交流。而这个数据有多大呢?如果一个站点有1000个采集点,每分钟采集一次,每天产生的数据有144万条,每分钟采集一次的IO数据是3.26Kb/s,每条的数据量按200B计算,每天的数据量就有275M,一年的的数据量就是98G。如果30万个站点,就会产生3亿个测点,我们每天的采集数据就为4320亿条,每天则会产生78.6TB的数据。”
而利用好这些数据才能产生真正的价值。力维云通过对这些数据的分析,积累了对蓄电池、空调、配电、环境、视频的智能联动分析和管理。
力维云的大数据架构
同时利用大数据机器学习,通过WEB/APP UI的搜索引擎迅速将结果呈现给用户,让用户清晰的了解数据中心总用电量、主设备、空调用电量等相关数据。机器学习的人工智能还提供了诊断分析:帮助了解报警产生的根源,通过多维数据的时间关系深度分析找到根源。趋势分析,了解设备在温度上升过程中的趋势类型(线性,抛物,幂函数,指数型)。预测型分析,这也是下一代数据分析的最高层级,很多时候是需要人工智能给我们一些真正的建议。利用存储在DCG上的预测模型作为参考,对采集数据做快速清洗,高速在线分析和精确预测,而这些模型来自于力维云计算中的深度、精细化学习。
从滴滴出行到摩拜单车,共享的理念逐渐深入人心,运维也要做到共享。曹博士对此既自豪又兴奋,“力维云把共享作为服务,实现了IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)、MLaaS(机器学习即服务)四层的共享。”
曹博士进一步解释道:“首先这个云运维是一个SaaS平台,为用户提供软件服务,用户无需单独购买任何软件,所有的软件升级和维护均为免费。在PaaS层,为用户提供接入、存储、告警管理、设备管理、消息管理、移动网关、开放接口等服务平台,用户只需购买软件服务即可享受云运维平台提供的各种行业应用功能。在基础设施层面,用户无需自己搭建基础设施,通过租用力维物联网设备即可拥有力维积累的超过2000种设备协议的能力,减少了繁琐的工程配置,实现了迅速接入。最后,各种数据汇聚到云运维平台中可以保证数据的原始性、真实性、有效性、安全性,通过对数据进行清洗,最终经BI的形式呈现给用户,实现了机器学习平台的共享。”
这些都是通过云计算将能力进行了开放与共享,中兴力维的“力维云”服务在为用户提供省心、省钱、省力的解决方案,改变传统的高成本运维服务模式方面也卓见成效。曾涛对此次颇有感触,“贵州茅台在全国有318家直营店,遍及全国28个省,有的直营店身处四线小城镇,由于缺乏视频监控系统的有效运维队伍,茅台集团很难在短时间内建立一个便于对商品追踪的零售体系,为此找到中兴力维,最后选用了力维的整套云运维服务。到目前为止系统仍稳定运行,设备在线率达到95%以上,并为茅台集团提供了故障处理及分析报告,提高后续故障服务效率;同时提供了系统评估及改进建议以及设备更换评估及建议。”
建立生态 共同发展
曹博士指出,“未来要在技术和合作伙伴两方面下功夫,建立好一个良性的生态链,现在讲生态而不是竞争对手,就是首先在技术上要让物联网部署更快、更简单、更自动化,利用大数据的思维让数据中心实现国家节能减排的目标,使设备运转更加高效,为商业决策提供依据。”“而业务层面,随着接入的客户越来越多,基于数据,把制造商和客户连接起来,推出相关的咨询的服务,在生态链上做更深入的服务。”曾涛进一步补充道。