ODCC峰会现场
如何将IDC的数据转为核心竞争力
通常,DCIM是指数据中心基础设施管理。但在力维看来,对于一个数据中心来说,它的意义远远不只是对于基础设施的管理。
虽然今天大家都在谈大数据,许多企业也懂得如何产生数据,但是知道如何保存数据和利用数据的企业却非常少。而Google是一个既会产生数据,又会使用数据的公司。谷歌最擅长的是使得数据成为他们的核心竞争力,谷歌所有的产品,最初的目的只有一个就是产生数据。
当因特网的末端设备被智能化后,当数据中心被物联网化后,数据中心每天所产生的数据将以指数形式高速增长。数据中心运营者在优化及规划现有设施扩展的过程中,如何更好地运用系统里的数据采集量、多样性、预测性的价值和真实性,分析的能力和速度将变得尤为重要。因此,对IDC数据的理解还突显了IBM对大数据的五个定义:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实)。
而力维对DCIM的认识从最初的“基础设施管理” 到“综合管理”,又进一步向前推进到: “基于大数据概念的IDC综合解决方案。
ZNV中兴力维CTO曹友盛博士在演讲
IDC数据存在的难题与挑战
Volume(海量):目前的感知设备不够多,智能化还只是刚刚开始,对于数据采集的密度不够,视频数据的采集也相对缺乏,数据流能力的设计存在瓶颈。
Velocity(高速):对于百亿级数据查询的速度,报表分析的深度,统计的维度,在线分析的缺乏,3D组态的呈现速度。
Variety(多样):缺乏多维数据间的相关性分析,数据呈现孤岛性,温湿度、电压、电流、影像、GIS、气体、时间之间的联系和相关性缺乏。
Value(价值):IDC数据对于IDC经营者的价值在哪里? IDC经营者要改善IDC的运营成本、设备的使用率和出租率,如何做到高效、节能、省心、省钱、安全。
Veracity(真实性):IDC普遍存在的误告警、漏告警、事件误判、报表的真实性,对PUE的误解。
ZNV中兴力维展台
什么才是聪明的解决方案
力维认为可以提升5个V在DCIM中的应用。Volume(海量):增加感知设备布点,增加数据采集密度,关键设备全生命周期事件记录SOE,动环数据流能力设计;Velocity(高速):大数据引擎Hadoop-Spark, Kafka、HBase、高速读写、高速查询、高速统计;Variety(多样):历史数据累积,数据整理、清洗,对时、多维数据相关性分析;Value(价值):IDC数据的价值在于让IDC经营者能高效、安全、省心、省钱;Veracity(真实性):真实性是IDC数据需要通过时间来考考核的,Google通过了两年的时间,证明了DeepMind 能为它的IDC省下40%能耗。
针对数据流能力设计方面,力维的DCIM整体架构可以分为数据呈现、数据引擎、数据接入层、数据汇聚层。力维的“维统管”不仅能实现数据的处理、分析、挖掘、共享、深度学习,还能够接入汇聚各种协议、海量数据(百亿条数据),即便每天100万个检测点产生6TB的数据、168亿条数据。值得一提的是,维统管还可以实现高密度采集数据,100万个测点, 每5秒采集一次,一条测点数据是200B来计算,每天产生采集数据168亿条。
现场观众与力维展台工作人员交流中
力维的大数据规划
第一层是做到响应型分析:收集数据,报表统计,高速查询。即一个百万测点的IDC,每天可产生6TB的数据,需要一个NoSQL的高速数据存储, 年统计报表的变量可以在百万个以上,用SQL数据库是无法统计出来的。NoSQL技术可以实现百万变量统计报表<2秒。
第二层是诊断型分析趋势:报警产生的根源是什么?通过多维数据的时间关系深度分析,才能找到根源。趋势分析:在温度上升过程中的趋势可以是线性、抛物、幂函数、指数型的。
第三层是预测模型:预测型分析已经进入到下一代数据分析的顶尖层次,很多时候是需要人工智能给我们一些真正的建议,利用存储Alluxio上的预测模型作为参考,对采集数据做快速在线分析和预测,而这些模型来自力维云计算中的深度细化、深度学习。
第四层是认知转换:认知计算是大数据的最高层次。可通过提取来自工作流程、事件背景和环境的实时信息,帮助IDC经营者增强预测和决策能力,给业务带来更大的确定性,从而持续改进自身的业务流程,使IDC运营更加稳健。另外,认知计算可以帮助IDC从大量数据中发掘洞察,揭示以往传统方法无法发现的模式和机会,来提高重要研究的成功机率。