互联网+公交大数据大有可为
时间:2017-02-07 14:22 浏览量:次
9月5日,国务院印发《促进大数据发展行动纲要》(简称《纲要》),系统部署大数据发展工作,并提出:率先在交通等领域,实现公共数据资源合理适度向社会开放,带动社会公众开展大数据增值性、公益性开发和创新应用,充分释放数据红利。
近年来,随着智能交通、智慧城市等概念的不断推进,城市交通领域已经具有较为成熟的数据采集和应用技术基础。促进大数据发展,为 “互联网 +”时代下城市交通提供了发展新思路:一方面,大数据技术的应用为提升公共服务水平、促进产业创新提供了新的机遇;另一方面,大数据技术也为政府提升交通治理能力、缓解城市交通资源压力提供了新途径。
数据为城市交通“画像”
今年5月,罗兰贝格管理咨询公司发布了《移动互联下的城市综合出行变革》报告,对中国城市交通现状尤其是移动互联技术带来的出行变革进行了解读。报告中提到,预计到 2020 年,中国出租车数量将达到 138 万辆,公交车数量达到 57 万辆,私家车数量达到 1.76 亿辆。
海量的交通参与者也将带来海量的交通数据。在大数据时代,由于信息搜集、处理和分析技术的进步,可以更为快捷地获取或分析规划所需要的各项传统基础数据。城市交通所需要的各项基础数据将以“月”、“天”、“小时”甚至是“秒”为单位而被获取、分析和呈现。
另一方面,随着移动互联网技术的飞速发展,以及个性化、差异化的交通出行不断增多,城市交通蕴含的数据也将从单一的数据模式向更多层次、多元化的模式转变。6 月,滴滴快的成立了大数据机器学习研究院,在用户画像系统、智能匹配、需求预测系统和运能预测系统等方面做了大量研究。该研究院高级研究员胡尧表示,对数据的分析,这是数据交通产业链的关键。
滴滴出行副总裁张贝
其中,“用户画像”是移动互联网企业津津乐道的一项技能。对出行类 APP 而言,通过对用户出行习惯、消费习惯、评价行为等多维度数据进行分析,实现精准营销。
同样,源自不同方式、不同层次的交通数据可以为城市交通的组织运行规律“画像”,从而实现精准地服务与管理。例如,结合地铁与公交的运营数据,合理安排不同交通方式衔接;结合突发事件下道路交通的运营规律,妥善安排交通管制措施等。
滴滴:深谙数据与城市交通的渊源
提及滴滴出行,大多数人都会先想到网约出租车,事实上在背后支撑这一新事物发展的却是体量庞大的交通大数据。正如滴滴出行副总裁张贝所说,滴滴出行发展到今天,拥有七千名员工,其中大半都是产品、技术研发人员,尤其是大数据分析师等。看得出来,滴滴出行一直很重视大数据的运用,并坚持发展大数据构建技术,只为可以让司机提供给乘客更加美好的乘车体验。
“从最早用 80 万人民币创业起,滴滴那时并谈不上什么大数据技术,甚至连基本功能都不完善。经常司机抢单都没反应,动不动手机就死机,后来整个推翻重做,重写软件架构,不断优化,先是解决了司机抢单的问题。当然那会还有各种不完善,比如流量问题。前两年 3G、4G 技术并不完善,司机一天在软件上就要用掉 40M 流量,滴滴被司机们说是流量骗子,虽然有各种各样的不足,正因为有这些教训,滴滴认识到未来一定是技术驱动大数据应用。”张贝说到,“当时很多投资人问各种打车软件的创业者,你们认为打车软件未来的核心竞争力是什么?有人说抢占司机资源,形成壁垒;有人说补贴用户,赢得市场。这些都很重要,但滴滴一直坚定认为,未来核心竞争力在技术和大数据。”
事实上,滴滴出行一直都面临着大数据领域中世界级的难题和挑战,但有难度就有机遇。
对此,张贝认为难题解决好就是技术优势,也是竞争优势。“目前,滴滴有 4 亿的注册用户,超过 1500 万的司机,每天超过 2000 万的订单。每个司机、用户 3 秒钟上传一次位置数据,每天有 130 亿次定位数据存储,原始的数据存储量是 70TB,经过转存、处理之后的数据还要乘以 10,达到 700TB,还有超过 90 亿次的路径规划计算。总体用户规模从中美对比来看,中国人多、用户多,超过百万的城市我们有 140 个,美国只有 9 个,相差 16 倍。而且中国打车人多,公交发展不适应用户需求,而打车很便宜,开车反而成本更高,还有限行、限购的限制。中国现在每天两千万订单,美国和加拿大的出行市场每天 125 万订单,也是相差 16 倍。因此滴滴大数据处理面临的问题是世界级的,要求瞬时处理海量的数据,并且在非常复杂的城市路网上解决不平衡供需匹配的问题,要求有很高的处理能力。”
从交通领域看,滴滴的订单量已经是全球最大的移动出行平台。从跨领域比较来看,滴滴出行的订单量仅次于淘宝,已经超过京东;从复杂度来比较,淘宝的双十一购物节会产生庞大的数据量,同时也需要有瞬时海量处理大数据的能力。这一点是滴滴出行需要认真学习的。
然而,将电商和出行进行对比的话,电商的每一单计算量其实是比较小的。人们在网上下单,卖家接单,数据库里这个产品库存减 1,然后记录用户的地址,线下配送,完成交易。而在移动出行领域,每个司机、每个用户都是拿着手机不断移动,且这种移动将会影响滴滴出行派单。 “每天两千万订单简单除一下,每秒要处理几百个订单。每个订单分给哪个司机?在大城市,如果司机在第一时间错过了派单地址,也许这会让他兜回来很远的路才能绕回目的地,这样一来,再给他派单就没有任何意义,可以说这是复杂的动态问题,也是超 Np-hard 问题。我们后来发现每个订单的计算量相比于电商是它的 10 倍,每个订单背后有复杂的算法,体现模型优化的结果,而且是短短一两秒之内实现的。”据张贝所言,交通领域的大数据可谓是庞大而复杂,但又意义重大。 “
举例来说,出租车司机一般都会挑机场比较远的单,短途一般没有人响应。后来,我们利用上线滴米规则,即司机接长途订单就减滴米分,抢短途单就奖励滴米分,这样便解决了问题。此外,滴滴还经历了从抢单到派单的演变过程。从最早上线抢单,相比优步的派单法,滴滴认为适应实际情况更好的方式才能走得更远。从数据来看,在用户需求区域 2 公里附近画个圈,让圈里50~100名司机抢单就OK,其实完全不是这样。我们发现一开始司机喜欢抢单,因为他比较自由,自己掌握。我们也尝试派单,我们给司机端加一个按钮,他可以选择抢单或者派单。后来,越来越多司机发现,系统优化比自己抢单效率更高。多等 10 分钟不见得能抢到更好的订单,还浪费了时间。通过大数据分析,滴滴能够对乘客进行有效识别,有的司机每天早上 8 点固定接送孩子上学,就在这个幼儿园或者小学附近。我们在前一天晚上就把这个幼儿园或者小学附近早上 8 点的订单精准推送给他,这就实现了系统最优和个体最优的结合,司机也很喜欢,美好一天从滴滴接第一单开始。随着大数据技术的提高,精准派单,司机越来越信任平台,80%~90% 的司机自发接受派单。后来我们改成全部派单,再后来改成急速接单,只派给一个司机,只需要 3 秒,司机端自动响应。乘客更加便利,司机信任平台,我们都信任大数据计算,这就是最优的结果,实现系统最优和个体最优的结果。”张贝指出。
为了帮助司机提高效率,滴滴出行制作出了司机可以看到的实时供需热力图,并实时推送给司机,让大家了解哪个地方的需求更多,最终主动实现供需平衡。简单来说,通过智能分单技术实现平台效率提升和优化。
滴滴大数据得以充分利用,目前滴滴出行已发展到计算分析出智能推荐上车点来预测用户的行为,并且同步告诉司机。“现在超过 50% 的叫车都是在室内,大部分乘客是等车到了才出门。因此,我们预测用户到哪里等车,是小区西门还是东门,这样司机和乘客之间不用总是打电话,你知道准确的上车地点就好。我们看到现在有 23% 的订单是不打电话的,比以前下降了 3%(以前是 26%)。”张贝说到,另一方面,滴滴滴出行还可以智能预测出用户的目的地点。当乘客打开滴滴时,预测地点将直接放到菜单第一列,减少输入时间,方便乘客使用,一键实现打车叫滴滴。“这些数据是动态的,在不同的地点,根据你的出行情况,你想去的地点是不一样的。对于用户常用的地址,对高频用户我们第一列可以猜中 35%,对低频用户我们第一列可以猜中 25%,再加上第二列或者第三列,我们能够预测用户 90% 的常用地点。所有这些都是基于大数据的预测,让用户更加方便,也节省用户的时间。”
最后,张贝还介绍了滴滴服务分制度,并在今年 6 月份上线使用。滴滴出行将接单、接驾、送客行程后的评价分为四大维度、100 多个细项、 24 小时更新,转化为服务分。服务分越高,系统就越优先派单,这是总体的原则。“实际上,这其中包含了非常复杂的数据算法,我们知道就派单规则而言,并不是简单地将订单派给最近的司机,这里面还主要考虑了服务分因素。比如较远的订单(并不是很远的那种),服务分越高的司机,乘客便更喜欢。但是,必须将其控制在一定度范围内,太远的订单会导致接驾时间过长,这样一来司机的被取消率升高。那这究竟该如何平衡?此时大数据便起到非常重要的作用。我们构建多个机器学习的模型,输入不同的维度,让机器来平衡,通过不同的模型让大数据自动优化。服务分高一点,但是又不能太远,我们找 1 万个订单、100 万个订单,让机器按照不同模型学习,根据这个结果优化。”张贝说道。
总而言之,滴滴出行效率的提升,也将大幅提升整座城市的交通效率。而这其中的效率变化,是由大数据的运用与分析直接影响形成的。
让公交出行更科学、更合理
优先发展公共交通已经成为国家发展战略,但是,传统公交车不准点、乘车拥挤等问题影响了市民的出行体验。为了满足市民对公共交通不同层次的需要,深圳鼓励推出了“协议定制班车”,而滴滴巴士等“互联网+”公交产生的新型公交形式,提升了公共交通的吸引力。
106 路要优化线路、107 路要减少平峰车辆班次、105 路要增加站点……从今年年初开始,余姚市交通运输管理所优化配置公交资源,调整 36 条公交线路,一年预计节约运营投入 100 余万元,而这一切都有科学依据 -- 一本汇集了每一辆公交车“作息安排”数据的调研报告。
自 2012 年余姚城乡客运一体化改革以来,到 2014 年,余姚公交线路运营相对成熟,较好满足城乡居民出行需求,但也出现些许问题。比如,据统计,有些城乡公交每天的载客率不到 50%,更有甚者,如 612 路,从天下玉苑—双溪口水库,日发 2 班次客流量基本为 0,部分公交资源过度浪费,亟待解决。
于是,余姚市交管所积极发动所有公交司机的力量,对全市 105 条公交线路实际运行情况进行了摸底调查,记录下每条公交线路的道路状况、站点设置、运力投放、班次安排、高低峰时间客流、各站点客流等基础资料,形成了《运营线路拟优化调整报告》,为科学规划公交线路、合理安排车辆、班次,提高公交资源利用率,提供决策依据。
用数据说话,更有说服力,效果也更有保障。比如从大岚发往龙潭的 632 路公交车,原本是 2 辆营运车,10 个班次,但载客率不到 30%,而现在减少一辆营运车,优化发车时间后,不但不影响居民出行,反而提升了载客率,公交运力资源得到高效利用。再如,山区乘坐公交车的大多都是老年人,而且出行时间主要集中在早晚高峰,一般都是去镇里买菜,所以这些线路的班次就充分根据事实规律,减少平峰班次,满足群众高峰出行的实际需求。
“公交是一种大众化的交通出行工具,任何一条公交线路都不可能满足该线路上每个乘车群众的出行需求,所以每条公交线路投入的资源都应该是科学高效的,我们一直在努力优化调整公交线路,扩大公交覆盖区域,使公交线路运行更优化、更全面、更科学。”余姚市交管所相关负责人表示。
除此之外,北京公交集团运营的 1020 条线路将更加“智能”,通过大数据进行线路优化,根据客流情况安排运力,减少乘客等待时间,提高准点率。
北京公交集团目前已在所有公交车上安装了 GPS,通过数据共享,可以通过手机 APP 进行公交查询,未来将更多基于“互联网+”提升公交服务。
线路设计方面,将利用大数据辅助分析客流情况。北京市每天有超过 1000 万公交客流,乘客上下车刷卡的记录可以研判客流出行规律。集团会根据客流规律布局或者调整线路。
运力安排方面,通过公交车实时运行数据调整运营时间和计划。比如,某路车过去计划单程运行时间是 50 分钟。但因为堵车,可能 60 分钟才能到,运力在堵车中自然消失了。今后将可以根据实时大数据情况,按照 60 分钟来配备运力、增加车次,使乘客等候时间减少。
“智能化公交”成为集团的关键词。一是依据海量公交 IC 卡资源,建立“公交信息云平台”,为乘客提供出行信息服务。二是运用互联网提供智能化服务。三是引入手机、手环等支付方式,使公交移动支付方式更加多样。