人工智能技术在近几年已经成为全球大型互联网公司的必争之地。Google、微软、苹果和Facebook等都在积极进行人工智能等前沿技术的研发,以改进旗下服务和产品在图像、视频及语音处理方面的能力。此前美国知名高科技网站Xconomay的一篇介绍性报道指出,来自中国的搜索巨头百度,正在成长为全球人工智能领域的领袖型企业。此次发布的盲人助手“小明”,百度将其作为在人工智能领域研发的又一项成果。
从产品介绍来看,DuLight实际上是一套人工智能操作系统,对于盲人使用者而言,在家只需手机端安装,即刻将百度领先的计算机视觉和语音等技术变成身边触手可及的生活助理。当需要出门的时候,DuLight也配备一台由百度大脑驱动的智能可穿戴设备,“小明”的硬件端形态很像蓝牙耳机,用户佩戴之后就可以用语音的方式对“小明”发出指令。“小明”获取外界信息的方式除了接受用户发出的语音指令以外,更多地是通过内置摄像头捕捉用户第一视角的视觉信息,并通过用摄像头捕捉到的信息进行图像识别,随后通过图像语义理解对核心信息进行分析和讲解,通过一段时间的使用之后,设备还能智能推演出用户下一步可能进行的行为。
从发布现场的介绍来看,目前“小明”主要可以实现四个方面的图像识别功能。图像识别技术典型的任务包括物体识别、物体检测、图像分类标注等,百度构筑了的这套比较完整的图像识别系统,能够有效地处理特定物体的检测识别(如人脸、文字以及商品和各类物体)、通用图像的分类标注、以及主观图像质量评估等问题。这次在DuLight图像技术上尤其凸显实力的是通用识别功能,这是百度最新研发的“机器读图”技术,“小明”可以根据拍摄到的图片内容自动生成一段描述文字,这项技术基于百度大脑的深度学习技术,在高层语义层面建立了图像和自然语言之间的桥梁,使计算机能够真正地学习、建立语言体系,并感知到的物理世界之间的联系,可以说是人工智能领域的一次技术飞跃。
除了应用了百度IDL领先的机器智能技术之外,“小明”还可以通过对用户第一视角的画面进行视频直播,让远程协助者可以实时看到盲人朋友眼前的状况,从而帮助盲人朋友即时解决衣食住行等生活问题。“小明”还特别针对人民币钱币进行了识别优化,再也不用担心纸币上的盲文因使用过多而变得难以通过触觉识别了。另外,“小明”还配备了人脸识别功能,目前百度的人脸识别的错误率仅为0.23%。
百度称,盲人助手“小明”的推出,不仅可以帮助盲人“感知”真实世界,还可以成为新的实体搜索入口。通过对用户第一视角的视觉信息进行图像分析,并结合百度大数据分析能力和自然人机交互技术,“小明”可以为大众提供所见实体背后的信息及相关服务,更好地帮助用户认知世界并连接服务,百度深度学习实验室的主任研发架构师顾嘉唯提到,伴随着人工智能和人机交互技术的不断发展,从BaiduEye到DuLight,可穿戴设备形态的对话式智能助理正在走向真实场景。