2019这一年 智能交通人在思考什么?
记得三年前刚接触智能交通这个领域的时候,一位行业前辈告诉我:智能交通数据的潜在价值还没有得到有效挖掘,交通信息的感知和收集有限,行业存在各个管理系统中的海量数据无法共享运用、有效分析,交通态势的研判预测乏力,公众的交通信息服务很难满足需求......
三年后的今天,各地采集的数据浩如烟海,到处都举着“大数据”“采集数据”、“打通数据”的旗帜,彰显着各自拥有的“交通数据”,似乎交通行业已经不缺数据了。
市场真的是这样吗?!
行业人在思考什么
这段时间不止一位业内人士向赛文交通网感叹:这个行业,大家都热衷做简单的事,而对正确的事视而不见,不愿意从根源上解决交通问题。
比如前几天北京的一位老师表示:“我发现这个行业大家更关注所谓的平台,其实平台只是将前端结构化的数据碰撞、组合进而呈现的一种手段。从商业的角度来讲,‘平台’比较好理解,而‘前端特征工程’既单调又难以理解。从商业角度,我可以理解大家宣传‘平台’的初衷,但在大数据时代,我们应该认识到除了关注‘平台’呈现之美外,更应该关注使数据来源多维度和广泛性的前端感知技术。否则这种“呈现之美”将成为无源之水。“
再比如赛文信控俱乐部一位专家表示:“这两年一二线城市都在做大数据平台项目,一二线大城市通过各种感知设备收集到的数据是可以用来提升道路交通信号优化的水平,但中国绝大多数城市还是做不到的,因为很多中小城市现在连信号灯等一些基础设施都还没有完善规范,这些城市现在也开始喊着要建设大数据平台,这是非常不科学和不现实的。”
感叹的人多了,我认为这个问题有拿出来讨论的必要了。
先来看看他们在感叹什么?
我看到的是行业需要数据。
行业需要什么样的数据
那我们到底需要什么样的数据?
2019年12月下旬的一天,我用这个问题采访了圈内的八位前辈,有企业创始人,有行业专家、有高校老师、也有交通部门领导,前辈们都站在各自立场和关注的方向谈论了行业所需要的数据类型,但有一点是前辈们一致认同的:大数据虽然支撑着智能交通的前行,但其发展道路上还存在着很多问题,问题就是数据量不够。
“这个问题太大,不是几个行业人就可以说明白的,你需要细化你的问题,才能看的更明白。”也有前辈直接指出我的采访问题不合理。
那就从什么是“交通大数据”开始捋。
其实行业内缺乏对交通大数据的定义和诠释,大家对大数据的理解是:只要数据量大,就是大数据,更有不少人认为只要“种类丰富、数据量大”就是所谓的大数据。
上述认识比较片面,其实大数据本身具有“多元异构”的特征,即数据来源多元化、数据结构复杂化。除了交通行为产生的数据外,所有能够服务于交通管理的数据都可以被称为交通大数据。
量大、种类多、结构化是交通大数据的主要特点。
量大比较好理解,指海量的数据积累。但现阶段业内对交通大数据的分类是缺失的,从数据供应商到数据需求方都没有统一的划分标准,一年前赛文曾发布过一篇《交通大数据的分类》文章,作者将交通大数据分为“政务数据”、“运营数据”、“物联网数据”和“互联网数据”四大类。
“政务数据”是指在政府管理中所产生的数据 ,政府政务数据的产生依托于政府各个部门信息化建设,也就是说政府各个部门的信息系统产生的数据就是政务数据。
“运营数据”是指经国家授权经营的企业在运营生产中所产生的数据。
“物联网数据”是政府投资建设或授权建设的交通感知数据。
“互联网数据”是指互联网公司通过运营所产生的数据。
结合实际的市场需求,从行业应用角度来看,与其思考行业需要什么样的数据,不如考虑行业应该如何收集数据来的更实在。据赛文观察,交通基础数据的准确性、连续性、稳定性、重要性越发凸显,比如目前的一些平台或者解决方案有些已经成了“摆设”,数据缺失、不完整、格式不统一是造成平台成为摆设的主要原因,智能交通行业中平台没有数据输入,缺少数据支撑,导致其失去了真正意义的案例比比皆是。
数据采集是大数据价值挖掘中重要的一环,其后的分析挖掘都是建立在数据采集的基础上。采集到数据以后,我们还需要对这些数据进行结构化。简单来划分,交通大数据就是由一大堆结构化的和非结构化这两部分数据组成,因为数据量太大,没办法直接使用,大家需要从中抓取出有价值的内容或想要的数据来应用,结构化的数据才更有意义。
提到结构化数据,赛文发现一个很有意思的行业现象:如今越来越多的数据业务逻辑在开始从后端转移到前端。比如精英路通高位视频技术现在在前端就将数据都进行特征识别,都标签化,前端回来的数据都是结构化好的。问起缘由,北京精英路通副总经理孙巍巍解释道:后端结构化和前端结构化只是技术架构的区别,精英路通采用前端结构化数据是基于未来V2X考虑,是为了充分利用前端边缘计算,提高边缘响应速度,因为数据往复传输时间很长。
“大家都说大数据技术的意义不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提必须是拥有大量精准和多维的数据。”
北京精英路通副总经理孙巍巍对赛文交通网表示,从企业角度来看,足够的数据量是企业大数据战略建设的基础,因此数据采集及其精准性、多维性就成为大数据分析的前奏。
行业中绝大多数企业现在还很难判断到底哪些数据未来将成为资产,通过什么方式将数据提炼为现实收入。
对于这一点即便是大数据服务企业也很难给出确定的答案,但有一点是肯定的,大数据时代,谁掌握了足够的数据,谁就有可能掌握未来,现在的数据采集就是将来的资产积累。精英路通作为智能停车行业的运营商,项目已经落地十几个城市,每天会产生大量的与停车相关的数据。
“静态交通是智慧交通不可或缺的一部分,以静制动亦是很多行业研究者对于改善城市交通有效措施的重要建议。停车大数据归根结底将为治理者所用,精英路通会在治理部门或相关政府机构授权或委托的范围内,对数据进行脱敏处理,以治理需求为导向,展开以静态交通为基础的智慧交通实践方案研究,为中国的交通智能化、交通智慧化做出应有的贡献。”
孙巍巍认为,未来交通行业重要的是前端数据的规模化、精准化及多维化采集。
拿智慧停车领域来说,视频识别应用于停车管理的关键点在于准确识别车辆、车牌以及停泊位状态,同时和互联网技术结合实现全自动计时、计费和电子支付,全程留存图像证据链。
当然,停车数据只占“交通大数据”中很小的一部分,行业更需要的是“大而全”的数据量。
写在最后
行业需要大量的种类齐全的结构化数据。
对,也不对。
我们知道大数据分析是需要场景设定的,由要解决的问题驱动,离开用户需求和应用场景谈大数据分析,是忽悠,是空谈。同样的道理,行业真正需要的是能够解决实际问题的“数据”,应当结合行业需求,来考虑这个问题,当前市场重要的还是如何采集到数据问题。对于交通来说,大数据不是一个单纯的技术革新,而是推动整个行业进步的技术变革,但目前显然还达不到这种变革。
目前的交通大数据应用仍然是初级阶段,大数据技术不适用于所有应用场景,也不能解决所有交通问题。主要是技术发展过程中还存在一些亟待解决的问题,比如国内数据开放程度低,没有充足的 “大”数据;数据应用概念不落地,没有技术支撑;数据服务或者技术服务目标不明确,只为建设而建设;定制化属性难以标准化,难以达成规模效益。