文/柳文凭 浙江宇视科技有限公司解决方案架构师
最近,娱乐圈有一个突然火起来的老人——清华理工男李健,他快速火起的主要原因是因为在《我是歌手》这个节目上,虽然他话不多,经常一语点破玄机,在看似冷场的情况下,总是拨开云雾,展现柳暗花明又一村。
与之相对应的我们熟悉的另外一个疯卷大陆的娱乐节目《中国好声音》主持人——华少,则是凭靠着其一秒九字的语速,在短短45秒的时间内说完“正宗好凉茶正宗好声音欢迎收看由凉茶领导品牌加多宝为您冠名的加多宝凉茶中国好声音喝启力添动力娃哈哈启力精神保健品为中国好声音加油。本届中国好声音所有学员当中四位导师最得意的门生将踏上娃哈哈启力音乐梦想之旅。发短信参与互动立即获得苏宁易购的100元优惠券感谢苏宁易购对本节目的大力支持。我们的好声音学员如果获得三位或者三位以上导师认可即可获得苏宁易购提供的1万元音乐梦想基金。感谢上海新锦江大酒店为中国好声音导师提供的酒店赞助。关注加多宝凉茶中国好声音台前幕后更多精彩内容,你可以@中国好声音新浪微博,或者是腾讯微信以及登陆中国好声音百度贴吧参与节目互动,还可以登陆优酷,搜狐视频,爱奇艺,土豆网观看节目的精彩花絮,关注网易娱乐了解更多节目的信息或者登陆官方数字音乐平台,下载每期节目最精彩的歌曲彩铃。”这350字,让电视台在有限的时间内疯狂赚取广告钱。
那么这两个人哪个更能够吸引你的呢?不管你喜不喜欢,反正我是很欣赏李健的。因为他的语言简练、聪明,能够用极为简练的一句话把事物的条理梳理清楚;而华少仅仅是快,大量的语言堆叠,让我根本听不清在说啥。
其实这和现在安防界风起的大数据也是一样的。大数据系统,我们是仅仅想要他的快?还是想要他的既快且聪明?
估计大家都是想要既快且聪明吧。
安防演变至今,摄像机越来越清晰,数量越来越多;这带来了庞大的数据采集量,为了能够更清楚的知道视频中都有什么内容,视频结构化是安防现在的重点发展方向,公安部在近两年分别发布了两个与视频结构化相关的标准,即GA/Z 1129-2013 《公安机关图像信息要素结构化描述要求》和GAZ1164-2014 《公安视频图像信息联网与应用标准体系表》详细规定了如何标准化进行图像结构化描述。
但是大数据仅仅就是让摄像机内容进行结构化描述吗?并不是,这仅仅只是一小步。每个摄像机的信息采集量结构化之后用语言描述,相当于一本书。如果一个城市有3000个摄像机,我们谁都没有本事一天内把这三千本书读完。就像我们谁都无法听清华少的广告词一样。只有我们做到数据界的李健,让数据变得聪明,能够梳理条理,精炼语言,一言而喻,才能真正的让数据结构化发挥其本应有的优势,而这才是大数据应该做的工作。
即我们要让大数据聪明起来,而不仅仅是快;虽然快是大数据的基础。
要让大数据聪明起来,简单分工需要做到两步,一步要对数据条理化清洗,一步是直观化展现。
第一步:数据的条理化清洗,要求大数据能够理解案件研判的规律,并按照规律对数据进行归类整理,按照数据的种类和重要程度建立积分模型。积分模型的建立是聪明大数据的基础,也是关键。其研判的规律来自于我们公安干警的实际破案经验。
图1、数据积分模型
第二步:图形化展现是让数据更直观的一种方式,比如我们想搜索一个车牌,如果能够直接给我们一个车牌的轨迹图,而不是一辆车经过哪些地点、卡口的罗列,我们相信会更有用。
比如前段时间的全国大扫毒,在某市公安干警就利用车辆研判的积分模型进行数字化扫毒研判。干警们总结贩毒分子的规律一般都是在晚上12点之后到各个娱乐场所送毒。在这句话里边公安干警能够找到三个数据关键点:1、昼伏夜出;2、出入固定地点;3、频繁出入。
根据这三个数据关键点,公安干警利用积分模型分析半年内全城车辆,结果发现有12辆车符合这个规律。在对这12辆车的排查过程中,共抓捕了6批贩毒分子。
通过这个案例我们可以看出,聪明的数据能够充分发挥出数据应有的作用,能够为案件研判提供极大的辅助作用。所以大数据的核心应是如何让数据变得更聪明。而为了让数据更聪明就必须要给数据建立更多的数据模型让数据条理更清晰,这些模型的建立其实都是公安一线干警的实际研判经验。所以聪明的大数据依靠的不仅仅是提供技术的厂商,最关键的是依靠能够提供模型的公安干警。只有厂商和干警紧密合作才能让数据真正聪明起来。