本期嘉宾演讲为北京市政交通一卡通公司数据运营总监张翔带来的分享,看了他讲的内容才知道,我们每天都在用的公交卡真是一种神奇的东西,以它为媒介积累了海量数据,从中能进行各种有趣而使用的挖掘实践。
北京市政交通一卡通公司数据运营总监张翔
各位嘉宾、各位朋友,大家上午好。我今天带来的题目是北京市政交通IC卡数据在城市治理中的应用。
我主要讲三个方面,首先是北京市政交通一卡通业务介绍。第二是数据现状平台功能,第三是城市治理中的应用实践。
第一套是具有鲜明一卡通特色的数据治理体系。第二套是我们数据挖掘分析和计算体系。第三套是我们应用和展示体系。
在卡片当中应用比较多的像通勤的OD、充值的次数、票价敏感度等等都是标签。还有学生卡、老年人卡,我们单独会有专项的标签。目前我们发了1亿张,保有量8000万。但是正常活跃在用的大概是3000万张,我们经过一年的努力把3000万市民的画像基本上做全了,这也是为政府各项数据分析服务提供了基础。
我们的标签基本上分成三类,一类是公共交通类,一类是市政服务类,还有一类是外源融合类,包括天气数据、商业化的数据等等。
从这张图可以看出来,昊海楼中的工作人群(当然我们要限定了,它只限于公交方式的人群,私家车我没有加进去),他的出行距离、上班的时间分布、使用的交通工具,以及换乘的方式和各个区域之间的方式,可以很典型的通过这张图来实现。我们和国家发改委规划院和北京规划院有深入的合作,为他们的规划提供了支持,用他们的术语叫数据驱动规划。
前面我简单介绍了企业情况,以及我们的数据和数据平台的情况。下面我分四个方面介绍一下北京一卡通的数据,我把一年来做的各种案例梳理了一下,主要分为四类,一是政策效果评估,二是城市规划支撑,三是特定人群的分析以及服务,四是公共交通的优化。
第一个案例是北京的重大政策的评估。评估分为事前、事中和事后,北京在2014年做了一次票改,减少非刚需的地铁客流,引导客流的合理出行。我们取了票改前后各一个月的10亿条数据,我们在国内外交流的时候,很多专家告诉我们,至少这是国内第一份基于全口径的分析。票改后第一个月地铁刷卡次数减少了10%,从结果上来看,基本上达到了市政府票改的目的。
从这个图可以看出来,整个票改对北京人群出行影响有149万,同时一个月超过十次的我们称他改变了出行结构,我们把地铁转化为公交的定为票价敏感人群。这20万人群是下一步票改需要重点考虑的人群。
第二个案例选择的是2015年北京的大阅兵,阅兵的过程当中采取了交通限行措施,我们研究了单双号限行对整个北京区域内公交的影响。我们从右边可以看出来结果,限行期间和限行前,整个公共交通的出行增量增长了7%,其中公交增加了10%,并且早高峰提前了十分钟,地铁略降了2%。
因为这次是限行,主要是想让私家车出行转成公交方式出行。所以我们重点研究了一下有车族转至公交的情况。从上面的图可以看出来,前两周一次都没有坐过公交系统的,在限行期间内坐了两次或者两次以上的有329万人。在限行期间乘坐公共交通八次以上的有94万人,从效果来看达到了政策设计的目的。
现在政府非常推崇绿色出行,就是自行车。当然这个里面是直观的体现,从总人群上看增加了10%,每一个使用的频次都有相应的增加。
刚才是关于城市重大政策的事前、事中、事后的案例。因为北京区域非常大,各个区之间跨区的工作现象非常多,这里面我们和国家发改委一起合作,做了北京区域内的跨区工作的分布。
关于城市规划支撑,第二个案例是通州,通州现在被定义成北京的副中心。而且它的高度现在也被提到了已经不是北京的通州了,它是京津冀的通州。包括国家发改委、市发改委都委托我们研究通州它的公共交通影响的静态和动态的人群。
我们再看右边这张图通州工作外区居住,从这个图可以典型看出来朝阳、丰台和大兴区居住人群到通州上班的比例是比较高的。
这两张图反映的也是刚才的,是通州和各区之间的关系。下面是以热力图的方式来反映,左边是它的工作地分布,右边是通州的居住地分布。
北京的工作人群不仅仅受北京的影响,还受河北的影响,典型是河北的北三县,公共交通出行的工作人口中,超过40%是在北京的区域里工作,其中又以朝阳和通州的比例较高。
第三个案例是对特定人群的分析,原来我的PPT没有这个,但是这段时间有一个现象,英国的学者提出来用IC卡数据来抓小偷,好像在数据分析师圈子里面流传很广。实际上这件事情,我们五年前就在做和北京公交总队合作在做,为什么没有说呢?因为你说出来有负面影响,但是为了增加趣味性我今天就把这个题拿出来说一下。
我们有一套系统称为北京一卡通特定人群分析系统,它有三个层次。第一个层次我们可以分为大学生、中小学生、老年人、小偷、乞讨,它有一个宏观的北京市的整体的考虑,相关的政府部门必须考虑,我们按照他们的要求做的这套系统。其中灰色人群的体系里面,有一块专门是小偷、乞讨和其他的灰色人群,包括有些快递我们也归为灰色人群。
我们更多做的是一些普通人群,包括老年人、中小学生,特别是中小学生在北京是IC卡应用起到了相当大的作用。这四张图体现的是北京的中小学生每天通学的距离。
右边是通勤人群,我们可以看到北京人民还是很辛苦的。特别是出行公里数在25%左右是12到20公里,还有剩下16%是20公里以上,像我每天单程是20公里。
第四部分是我们公共交通优化的分析体系
我们是四个层次,第一层次是对整个路网的监控。第二层次是某一条路网的某一条。第三个层次是线路里面的站点。第四个层次从线路里面出来的人,以及人的轨迹的分析。
这是全天路网24小时动态分布图,颜色越深代表这个站点出行的人群密度越大。大家可以看到北京最北边和右下方这个位置有几个站,从早上开始一直要红到晚上十点钟。
第四个层次是个人轨迹,我们通过对个人通勤轨迹的分析,我们可以找出它的通勤方式的偏好,通勤的距离、时长、换乘的方式、居住的区域,以及它的工作的区域,居住区的车站分布等等特征都可以通过他的刷卡行为体现出来。当然如果再融合其他的外源数据可能有更深的发现。
整个这一块我们对标签画像轨迹的描述,对很多设计部门、政府管理部门,甚至是一些商业单位是很有价值的做法。我们四层结构的包括路网、线路、站点和个人分析,在工作当中对交通优化起到了很强的数据支撑作用。比如说对通勤班车线路的设计、公交、地铁站点之间换乘接驳,有很强的指导意义。
从刚才我们描述的诸多案例可以看出来,IC卡数据确实在城市治理当中起到了一些典型的效果。它提升了城市政策制定的效果和效率,提升了政府对特定人群服务的质量和水平。同时,它更可以优化公共交通资源的配置,我们北京一卡通公司做这种数据分析工作,已经有三四年时间了。在这三四年的过程当中,我们也应用了很多计算基础和国内国外的计算工具和方法。在做的过程当中,我们感觉到我们打开了一扇门,这个门里面目前做的是为政府提供服务。但事实上我理解就我们现在的数据基础和经验完全可以为社会提供更深的数据服务,可以为公众提供服务,甚至为个人提供服务或者是对商业企业做很多具体的应用。
后面几项是更广阔的空间,我们公司下一步确实在探索和研究,看是不是可以往商业化的方向考虑。我觉得在座的都是同行,如果大家有兴趣的话我们是不是可以从这几个层面。包括数据研究的层面和数据互换的层面,我们可以直接从商业层面合作,希望大家会后有机会可以交流。
更多阅读: