近日,海康威视研究院在KITTI评测中排名世界第一,表明其在计算机视觉算法上取得了重大突破。在车辆检测和车头朝向估计两项任务中,...
近日,海康威视研究院在KITTI评测中排名世界第一,表明其在计算机视觉算法上取得了重大突破。在车辆检测和车头朝向估计两项任务中,分别取得了87.27%与83.75%的AP(Average Precision)值,均排名第一。参加这项评测的研究机构及高校包括百度深度学习研究院、NEC北美研究院、加州大学等世界顶级研究团体。
下图为车辆检测排名结果
下图为车辆朝向估计排名结果
KITTI是德国卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合创办的一个算法评测平台,旨在评测对象(机动车、非机动车、行人等)检测、目标跟踪等计算机视觉技术在车载环境下的性能,为机动车辅助驾驶应用做技术评估与技术储备。
在车辆检测这一竞赛项目上,要求参赛者使用计算机视觉算法检测出由车载相机所拍摄的城市街道上的车辆,并且估算出车头朝向。用于性能测试的KITTI数据集包含了7千多张车载图像,单张图像上尺度不同的车辆数目最多可达十几辆,因此部分车辆会被其它车辆遮挡,检测难度非常大。海康威视研究院的预研团队基于深度学习算法,采用多任务联合学习框架,在性能上取得了突破性进展。
“车辆检测算法可用于汽车的辅助驾驶系统,为自动驾驶技术提供支持。我们预研的检测算法是一个通用的框架,可用于检测任意物体,在视频监控及车载监控领域具有广泛的应用价值。”海康威视研究院算法预研组负责人谢迪博士说。
“海康威视研究院的团队成员都是精兵强将。我们是一个年轻的团队,但我们有扎实的功底和坚定的信念。我们的目标就是向世界顶级的研究机构看齐,为公司的发展提供坚强有力的技术支持,进而推动行业的发展。”海康威视研究院常务副院长浦世亮博士说,2015年5月26日,习近平总书记莅临研究院,勉励科技人员多出成果,“这给了我们极大的鼓励。”
据了解,海康威视研究院由
智能分析、大数据技术、感知技术和多媒体技术等专业团队组成,突出在音视频技术的专注和积累,着重研究视音频的智能算法、大数据的分析、挖掘和计算,同时针对新的图像传感器等感知技术,视频的播放技术,人机交互等多媒体技术进行深入研究。目前在海康威视研究院众多领域的研究都走在行业前列。