在6月初的第七届云计算大会上,百度数据中心首席架构师张炳华分享了他对这些变革的洞察。“新时代对数据中心提出了更高的要求。”张炳华分析称,“数据中心规模从最开始的几十台到几百台到现在的数十万台服务器,这考验的是数据中心的规划能力;单机架功率密度从原来几安培、十几安培扩展到几十安培,考验的是供电及冷却能力;数据中心节点由单个建筑逐渐发展到园区、城市甚至区域数据中心集群,这考验着数据中心的业务调度能力;传输方面也由专线租用发展到骨干的二网融合,网络带宽从兆级变成T级,这对流量调度和网络性能要求也越来越高。”
随着互联网业务的快速发展,传统数据中心设计与建设方式已不能满足需求。在张炳华看来,数据中心ICT设施面临四个转变:第一,服务器解耦合与重耦合;第二,硬件解耦,资源池化并可重配;第三,基于SDN的高性能弹性网络;第四,IT设备与数据中心逐步融合。
据了解,百度已在这四大层面快速实践,并与数据中心关键设施协同,实现了三大创新。“首先,数据中心从定制变成预制;其次,冷却系统从水侧变成风侧;再次,供电系统由在线变成离线。”张炳华表示。
除了创新的硬件及基础设施,智能的运维系统来不可缺少。张炳华介绍称,百度的智能运维系统由监控系统、统一管理平台、大数据分析平台、策略决策平台四大模块组成。“从监控系统数据采集到处理展示,到大数据分析模拟,再到控制决策,最终由监控系统自动化的完成运行调优,形成了一个自动化运维的闭环。在这个闭环中,通过大数据分析决策及人工智能技术,人的参与会越来越少,平台自动运行的效率和可靠性会越来越高”。