在大数据时代,面临着一些很大的挑战,当然也有很多的机遇。其中,这三个重大的趋势正在影响着未来产业的发展,首先是大数据,如何从大数据中挖掘出具有更多的商业价值的洞察力,使我们更好的管理世界;第二个是云计算,云计算深刻的改变着不仅是IT行业还有其他的行业,当初是为了优化IT,包括数据中心的运作,降低成本,但是今天云计算的发展,更深刻的影响是为企业或者是客户提供服务和应用的方式;第三个是新的互联互动方式,有非常多的包括移动通讯在内的新的互联互动方式正改变人和人之间,包括任何事物之间的沟通。
谈到大数据,传统的大数据的数据来源是商业数据,包括人力资源的数据,商业运作的数据。今天的大数据,更多的是从其他的两个来源,一个是互联网,另外一个就是社交媒体。未来的数据从哪里来?答案是,80%的数据是从物联网来,而且是一种非结构化的数据。这些数据需要新的技术来处理,有非常多的噪音和不确定性,云计算提供了一个非常好的平台,移动通讯提供了很好的方式,使大数据产生价值,使最终被客户使用到或者是看到。
传统的技术就是基于记录的系统数据,很多的时候是结构化的。我们知道关于数据库技术,包括IBM最早的大型机研发,无论是从硬件还是软件的各个行业,各个方面,都是在过去的30-40年优化这一部分的系统,今天是叫做互动,和物理世界的互动,和人的互动社交媒体,这类系统和传统的基于记录的系统如何做一个很好的融合?做一个具有洞察力的价值,也是未来IT发展的一个重要方向。
对于物联网的理解
IBM把物联网看成是一个“包括”平台,它包括系统整体的架构,对整个的物理世界做更好的感知,更好的管理和更好的优化。我们今天也会看到非常多的行业,比如说能源行业,在构建一个智慧的电网,从发电到使用,包括中间的传输,能够做很好的管理,比如说有任何的系统,有任何的故障,我们能够在几分钟内很快的发现等等。
物联网的发展在过去的几年取得了非常大的进展,IBM梳理出了三个阶段:在物联网1.0的概念阶段,我们更多的是构建物联网的系统,使数据能够被时时的感知,时时的传输,然后做一些处理,这时候是更多的构建一个物联网的系统;后来我们开始了物联网2.0的研究,这一方面的工作,更多的是构建物联网的平台,使应用更高的被这个平台所支撑,物联网的数据的处理可能超越了传统IT信息处理的架构,如何构建更好的中间件的加强版,更好的处理物联网的信息;今天看到的一个趋势是物联网在往3.0的方向发展,有非常多的鲜明的特点,一个就是在数据分析这里,就是我们需要做更深入的数据分析,理解大量的物联网的数据,另外一个就是云计算,物联网会和云计算进行一个深刻的融合,使物联网的解决方案从云端提供给我们的客户,做这样子创新,是需要物联网的整个生态环境的构建。
IBM对于物联网的研究主要是看这样两类行业:一类是资产密集型的行业或者是重资产的行业,比如是能源,比如是石油,自然资源的管理,有非常多的资产,这些资产本身也是非常的贵重,如何用更好的方式管理这些资产,用更好的方式优化这些资产。另外一类行业就是互联设备行业,这些行业包括我们讲的智能家居,智慧医疗中的一部分,包括电子产品之类的,这里是讲的百万千万级的互联设备,连到互联网的平台上,产生了大量的数据,如何进行时时的分析,产生商业的价值。
物联网3.0的概念
IBM提供了物联网3.0的一个参考的架构。在物理之上需要构建一个物联网的云平台,这里面包括了对数据的处理,包括对物理世界的模拟的这些模型等内容,特别是物联网平台安全性的考量,在这之上会有一些垂直性的行业支持。其中,行业支持确实是要根据对行业数据的理解来进行分析。
在物联网1.0阶段,我们更多的是做数据的监控或者是采集,那时候很多的事情是停留在系统上。而在3.0阶段,将朝着两个最主要的方向发展:一个是价值的提升,就是我们需要做包括对物理世界理解的这种模型的分析。包括对物理世界理解之后,对物理世界进行控制和优化,这种可操作的决定和决策这是一个方向,物联网整个和大数据深度的结合;第二个就是解决方案走向云端,而今天很多的物联网的解决方案还是在本地来部署的,预测可能作未来的三五年可能有 30-40%的解决方案,就会在云端向客户进行提供。届时,物联网和云计算深度融合,使物联网的解决方案从云端提供给客户,更重要的一点,也会随时的改变我们,包括IT公司,包括利用物联网技术的各个公司的商业模式。
物联网的3.0需要很多的技术创新。首先是传统的IT数据的处理,需要得到一个升级。第二个就是需要引入物理模型。真正的理解这个物理世界,而不仅仅是对数据的相互关系做一个判断。第三个是需要引入认知计算能力,是我们更好的理解这个数据,包括更好的与物联网的管理者,操作人员做更好的沟通。
对物联网数据的处理技术,包括了数据的采集和数据的存储和分析是不够的。物联网的信息的量非常的大,我们如何构建一个系统,比如是一秒钟可以处理100万条甚至是200万条的信息。今天传统的数据更多的是基于记录的结构化的数据,那非结构化需要做一些怎么样的改变。
IBM有一项技术是利用物联网的技术对风力发电进行预测。如何可以准确的预测的新能源的产生?比如,如何知道72小时内一个风力发电厂可以产生多大的电力?这样,就会需要除了传统的数据处理,从IT的角度看的技术之外,我们还需要天气模型,包括对云层的移动进行深入的分析。很多的时候模型是有很多的,不但是某一个模型具体的参数,可能成百上千的参数如何的设置,更多的是要知道在怎么样的场合下,怎样的物理模型,怎样的化学模型,需要得到更好的采纳。如,在智慧的医疗方面,我们对一个慢性病进行管理,需要建立对慢性病管理的风险控制的模型,这里面有非常多的关于医疗方面的知识。
此外,要把认知计算引入到物联网这么一个数据分析中。大概在三、四年以前,IBM有一个系统,是在美国的真人秀当中打败了全美的冠军,标志着认知计算非常重要的里程碑。认知计算最重要的是提供怎么样的能力,一个是机器学习的能力,因为数据太大了,包括对物理世界的模拟也非常的多,超过了本身编程的能力,我们需要未来的产生或者是基于洞察力的系统,具有自我学习的能力,从自我的实践中得到一个提升。另外一个就是全新的新的人机交互的方式,也使得我们对物理世界进行管理和优化的时候,这个系统和操作的人员之间是一种全新的不同的体验。
IBM有一个研究的项目,叫做IBM的“绿色地平面”这个是IBM和中国研究院牵头,把12个研究院的能力带到中国,利用互联网、大数据、云计算技术,解决包括能源和环境的问题,如何构建一个基于大数据的物联网系统,使我们更好的来做新能源的利用?能源利用完了以后,如何时时的检测不同的企业的能耗,改善我们的节能减排?如何对环境的检测和环境的改善起到一些作用?作为IBM“绿色地平面”这个计划的一部分,我们现在做的一件事,即构建一个系统,可以比较准确的预测一个城市72小时PM2.5达到一个怎么样的程度,比如是1公里×1公里的范围内,我们做了一个预测,是基于物联网的实时数据,包括天气数据,从卫星获得的数据做这样的预测,才可以做结构的优化,PM2.5超过了多少,可以达到我们的预期。
边缘计算的概念
谈到了3.0的概念,从IBM的角度来看,我们觉得未来的一些很重要的一些其他的重要的发展的方向,除了物联网的数据的搜集,传送到云端,另外一个就是边缘计算的概念,一个是大量的数据是在边缘端产生的,这个边缘段可能是手机,可能是传感器,90%的数据是没有被利用的,很多是在毫秒级就消失了,因为我们没有足够的存储的能力,或者价值就是一个时时的价值。
数据采集的增长速度,远远的超过了带宽的增加,我们不可能都送到云端进行处理。另外,据预测2017年所有的智能手机的计算量和存储量将超过全球服务器的计算量和存储量。
这就提出了一个新的概念,如何构筑从云运算到边缘计算,一方面在云端做,一方面是在边缘带做,如何编程,如何让这个系统可靠的工作,都是未来需要深刻研究的领域。
“如何更好的模拟人脑思维?”是IBM去年做的一个项目,通过一款芯片完全的模拟人脑,特别是形象思维。人脑的功耗大概是20瓦。20瓦的功耗做我们的形象思维。现在是做到54亿的晶体管,可以模拟100万个神经原,加上25000个凸处,模拟人脑的体系结构可以做到70瓦的能耗。
这给我们提供了很好的想象力,未来的芯片应该怎么走。IBM每年有一个全新技术展望,整个要做的就是每年会有一个努力预测未来三到十年的重大的趋势。这是我们去年做的,我们看到未来无论是18个月,还是10年,我们认为对IT技术会有非常影响的技术,会对物联网的研究和发展有非常大的影响力。
物联网的技术发展到今天,已经深入的融合到了各个行业,创新也是需要一个跨学科非常开放的心态来做这个创新的。