2023交通运输公共数据开放利用报告--开放数林VIP专享VIP免费

1
公共数据开放利用报告
交通运输
001
001
引言
全国交运数林概貌
交运数林指标体系
交运数林指数
地方交运数林标杆
交运数据开放国外案例
交运数林建言
交运数林指数评估方法
附录
001
003
008
012
016
042
061
063
070
本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:
21&ZD337)的阶段性成果之一。
本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范:
复旦大学数字与移动治理实验室 . 2023交通运输公共数据开放利用报告[R/OL]. (2023-05-25)[引用日期,
格式为 YYYY-MM-DD]. http://ifopendata.fudan.edu.cn/report
1公共数据开放利用报告交通运输001001引言■全国交运数林概貌■交运数林指标体系■交运数林指数■地方交运数林标杆■交运数据开放国外案例■交运数林建言■交运数林指数评估方法附录001003008012016042061063070本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范:复旦大学数字与移动治理实验室.2023交通运输公共数据开放利用报告[R/OL].(2023-05-25)[引用日期,格式为YYYY-MM-DD].http://ifopendata.fudan.edu.cn/report001引言近年来,国家对公共数据开放工作高度重视。2020年4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》首次将“数据”与土地、劳动力、资本、技术等传统要素并列,提出要推进政府数据开放共享,研究建立促进企业登记、交通运输、气象等公共数据开放和数据资源有效流动的制度规范。2021年3月13日,《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中提出要"扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放"。2021年12月,国务院办公厅印发《要素市场化配置综合改革试点总体方案》,再次要求“优先推进企业登记监管、卫生健康、交通运输、气象等高价值数据集向社会开放”。交通运输部在印发的《推进综合交通运输大数据发展行动纲要(2020-2025年)》(交科技发[2019]161号)中明确将“深入推进大数据共享开放”作为五项主要任务之一。2021年12月,交通运输部发布的《“数字交通”十四五发展规划》针对“行业成体系、成规模的公共数据较少,数据开放与社会期望还存在差距”的现状,提出“研究制定交通运输公共数据开放和有效流动的制度规范,推动条件成熟的公共数据资源依法依规开放和政企共同开发利用”。作为国家经济命脉,交通运输领域生成和储存的公共数据内容丰富,应用面广,开放交通运输领域的公共数据对助推数字经济和数字社会发展具有重要意义。2021年起,“中国开放数林指数”系列报告定期发布交通运输公共数据开放利用报告,这也是“中国开放数林指数”系列报告下首个持续发布的行业领域类报告。002“中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室制作出品,自2017年5月首次发布以来,定期对我国政府数据开放水平进行综合评价,精心测量各地各领域“开放数木”的繁茂程度和果实价值,助推我国政府数据开放生态体系的建设与发展。开放数据,蔚然成林,“开放数林”意喻我国政府数据开放利用的生态体系,每一个地方和领域的开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成长为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。003一、全国交运数林概貌目前,国家交通运输部官网数据开放栏目(链接:https://www.mot.gov.cn/sjkf/)与交通运输部综合交通出行大数据开放云平台(链接:https://transportdata.cn/)都已开放了来自交通运输领域的数据集。两个平台无条件开放的数据集754个,数据容量近9千万,数据内容主要涉及国内部分省市的交通线路站点、客运站班次、线路、货运车辆、运输与维修经营业务等方面。同时,还开放了来自航空公司和OpenITS联盟的研究数据。同时,“出行云”平台上还开放了153个有条件开放的数据集,内容主要涉及国内部分省市的地面公交、出租车、运输车的定位数据,轨道桥梁隧道数据,公交、出租车的线路、站点站台与票价数据,公路高速路路线与收费数据,百度地图路况数据以及与人口、房价、气象等相关的数据。截至2022年10月,我国已有208个省级和城市的地方政府上线了数据开放平台,其中省级平台21个(含省和自治区,不含直辖市),城市平台187个(含直辖市、副省级和地级行政区),共开放了283413个有效数据集。其中,有11个省级和96个城市平台共开放了9489个交通运输领域数据集。交通运输领域开放数据的主要提供机构包含交通运输部门、公安部门、地铁/轨道集团、公交公司等。与其他条线部门相比,交通运输行业开放的数据集总数仅次于教育部门,其次是文化旅游、农业农村、民政、市场监管、统计等部门;交通运输部门开放的数据容量达到10.81亿,在各部门中仅次于市场监督管理、生态环保部门,其次是住房和城乡建设、城管、医疗保障等部门,如图1和图2所示。004■图1各条线部门开放的有效数据集总数■图2各条线部门开放的数据容量(单位:万)23234642151876478011821241159917421785190020412080241924952844284429493337341436433667368138404555549658306403752494899872020004000600080001000012000民族宗教国有资产监督管理发展改革(含物价、粮食)金融监管新闻出版广播电影电视气象税务审计档案科学技术医疗保障经济和信息化/工业和信息化商务司法公安国土(规划和自然资源)水利生态环保城管住房和城乡建设体育卫生健康应急管理(含安全生产监督管理)人力资源和社会保障财政统计局市场监管(含工商、质监、食药监)民政农业农村文化旅游交通运输(含轨道交通、公交公司)教育85991234825136291465268235143629395640004217429945174962505851655489578368251074312480129041348615458158581616032537108060129913147146020000400006000080000100000120000140000160000国有资产监督管理审计金融监管经济和信息化/工业和信息化民族宗教科学技术统计局发展改革(含物价、粮食)档案卫生健康财政新闻出版广播电影电视体育税务应急管理(含安全生产监督管理)农业农村教育公安商务国土(规划和自然资源)人力资源和社会保障文化旅游水利民政司法气象医疗保障城管住房和城乡建设交通运输(含轨道交通、公交公司)生态环保市场监管(含工商、质监、食药监)图3和图4分别是各省域开放的交通运输领域有效数据集总数与数据容量的空间分布,颜色越深的省域所对应的数据数量也越多。从图中可见,开放交通运输领域数据数量较多的省域集中在东部地区(山东、浙江、广东)以及西部的部分地区(四川、贵州)。005■图3省域有效数据集总数空间分布■图4省域数据容量空间分布006在数据数量方面,2022年全国开放的交通运输领域有效数据集总数比2021年增长约6%,无条件开放的总数据容量同比增长386%,呈现爆发式增长态势,单个数据集平均容量也有显著提升。而各地开放的交通运输领域数据集在总量与容量上仍然存在显著的地区间差距。这些交通运输领域的数据主要由各地政府部门提供,少部分地方能够开放来自国企、事业单位的交通数据。在数据质量方面,各地开放的交通数据仍以静态数据为主,只有个别地方在数据开放平台上提供了少数实时动态数据。数据持续性有待提高,相比2021年,2022年各地开放的交通数据容量增长比例的中位数为10%,存量数据更新比例的中位数仅为18%,各地持续开放与更新数据集的程度仍然不足,多数数据停止更新或更新频率低,甚至存在碎片化与低容量等质量问题。各地开放的数据在标准规范上也不一致,缺少详细的数据字典描述说明,各地数据接口调用方式各不相同,复杂度较高,接口不能用、不易用的问题普遍存在。在数据利用方面,少数地方在交通运输领域已开展了诸如开放数据创新利用比赛、项目案例试点等利用促进活动,产出了部分有效成果。但各地的利用促进活动类型仍较为单一,且利用主体主要为企业,个人、社会组织、高校等其他社会主体参与利用的程度不足,交通运输领域的开放数据利用尚处于起步阶段。在法规政策方面,北京市、台州市等7个城市制定了专门针对交通运输领域数据开放的法规政策,对数据开放、全生命周期安全管理等方面作出了详细的规定。其他地方在有关“公共数据资源管理”“公共数据”的法规政策中,虽然在涉及数据开放范围和利用促进的相关内容中提及了“交通运输”领域,但未具体展开。007《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”目前,北京、上海、广东、浙江、重庆、海南、深圳、成都等省市已经以地方法规形式,初步构建起公共数据授权运营的基本原则与机制,正式迈入实践落地与规范发展阶段。表1是目前已经公开上线的地方政府公共数据授权运营平台链接,福建省与海南省两个省级地方,以及成都市、南京市、青岛市三个副省级城市都已上线了公共数据授权运营平台,其中海南省、成都市与青岛市在平台上运营交通运输数据集并提供相应的交通运输领域的服务与产品。■表1地方政府公共数据授权运营平台008数林指标开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成"中国开放数林指数"评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,立足我国政府数据开放的政策要求与地方实践,借鉴国际数据开放评估指标体系的经验,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重,如图5所示。二、交运数林指标体系■图5开放数林指数评估指标体系的构建方法009数林指标基于开放数林指标体系,结合交通运输领域特点,报告重点从准备度、数据层和利用层三个维度及下属多级指标对交通运输领域开放的公共数据开展评估,如图6所示:准备度是"数根",是数据开放的基础,包括开放要求和安全保护要求等两个一级指标。数据层是"数叶",是数据开放的核心,包括数据数量、开放范围、关键数据集质量、关键数据集规范、关键数据集安全保护等五个一级指标。利用层是"数果",是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量、成果价值等五个一级指标。010数林指标■图6-1交通运输领域开放数林指数评估指标体系011数林指标■图6-2交通运输领域开放数林指数评估指标体系012数林指数2023交通运输领域开放数林省域指数如表2所示:浙江省与山东省的综合表现最优,进入A+等级;广东省与贵州省也表现优异,进入A等级,其次是四川省、福建省等省域;在单项维度上,浙江省在数据层上表现最优,山东省在利用层上表现最优,均进入A+等级。2023交通运输领域开放数林城市指数(前三十)如表3所示:德州市与杭州市的综合表现最优,进入A+等级;日照市、青岛市、上海市、金华市、烟台市与深圳市也表现优异,进入A等级,其次是贵阳市、台州市、威海市、济南市、丽水市等城市;在单项维度上,德州市在数据层上表现最优,青岛市与杭州市在利用层上表现最优,均进入A+等级。三、交运数林指数013数林指数■表2交通运输领域开放数林指数综合等级(省域)014数林指数■表3交通运输领域开放数林指数综合等级(城市前三十)015数林指数省域交通运输领域开放数林指数空间分布如图7所示,颜色越深代表指数综合等级越高。数据开放水平较高的省域主要集中在东南部沿海地区的浙江、山东、广东等省域以及位于西部的贵州、四川等省域,成为全国交通运输领域的优质“数木”。■图7交通运输领域开放数林指数空间分布(省域)016四、地方交运数林标杆数林标杆(一)准备度浙江、山东、江苏、杭州等多地将交通数据作为重点和优先开放的数据。比如在2022年发布的《山东省公共数据开放办法》中将交通数据作为重点和优先开放的数据类别之一,如表4所示。■表4《山东省公共数据开放办法》对开放重点的规定(二)数据层1.数据数量截至2022年10月,各地共开放了9489个交通运输领域的有效数据集,数据总容量达到13.5亿,相比2021年增长386%。图8是两个年度数据数量的比较,在数据集总数没有明显增加的情况下,数据容量快速增长,单个数据集平均容量显著增加。017数林标杆8985278219489135075有效数据集总数数据容量(单位:万)2021年2022年■图82021与2022年全国地方政府开放交通运输领域有效数据集与数据容量比较数据集总量统计的是平台上可通过下载或API接口获取的有效数据集总数。数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。图9和图10分别列出省域与城市数据容量排在前十的地方,并反映了地方有效数据集总数、数据容量和单个数据集平均容量之间的关系。数据容量更能体现一个地方的数据开放总量,单个数据集平均容量则更能反映一个地方开放数据集的平均水平。例如,浙江全省有效数据集数量虽然相对较少,但数据总容量仅次于山东省,而单个数据集平均容量均远高于其他省域。德州市开放的有效数据集总数并非最多,但开放的数据容量和单个数据集平均容量都是最高,单个数据集平均容量达到55万。018数林标杆024681012141618020004000600080001000012000山东浙江广东四川贵州宁夏江苏福建湖北安徽有效数据集总数数据容量(单位:万)单个数据集平均容量(单位:万)1861299749405435220158780102030405060020004000600080001000012000德州日照金华杭州丽水滨州嘉兴青岛贵阳中山有效数据集总数数据容量(单位:万)单个数据集平均容量(单位:万)1861299749405435220158780102030405060020004000600080001000012000德州日照金华杭州丽水滨州嘉兴青岛贵阳中山有效数据集总数数据容量(单位:万)单个数据集平均容量(单位:万)■图9省域有效数据集总数、数据容量与单个数据集平均容量比较■图10城市有效数据集总数、数据容量与单个数据集平均容量比较019数林标杆2.优质数据集2.1高容量数据集报告将各地开放的交通运输领域数据集中容量最高的前1%作为高容量数据集,并统计了其在各地区的分布。省域开放的交通运输领域数据中,高容量数据集最多的省域如图11所示,山东省开放的高容量数据集最多,达到43个,远超其它省域,其次是浙江省、广东省、贵州省和四川省。城市开放的交通运输领域数据集中高容量数据集数量最多的是金华市,其次是杭州市、滨州市、巴中市、淄博市等地,如图12所示。■图11高容量交通运输领域数据集的省域分布4325731山东浙江广东贵州四川020数林标杆■图12高容量交通运输领域数据集的城市分布1287665444333金华杭州滨州巴中淄博青岛德州日照威海东莞贵阳温州表5和表6是省本级与城市开放的数据容量最高的前10个交通运输领域数据集,省本级开放的高容量数据集主要集中于企业经营许可、运输证、车辆船舶道路桥梁基本信息等方面,城市开放的高容量数据集主要集中于公交出租车实时位置、公交线路站点、违章案件等数据。这些数据以静态为主,动态数据仍旧较少。■表5省本级平台开放的前10位高容量数据集一览表021数林标杆德州市齐河县公交公司开放的“齐河县_公交实时信息表”数据集容量达到10亿,为城市在交通领域无条件开放的数据集的最高容量,包含32个字段,约3100万条数据,相应敏感信息做了脱敏处理,如图13、图14所示。■表6城市平台开放的前10位高容量数据集一览■图13德州市开放的“齐河县_公交实时信息表”数据集022数林标杆■图14德州市开放的“齐河县_公交实时信息表”数据集数据项杭州市公安局开放的“公交车辆GPS信息”数据集容量达到438万,包含13个字段,约34万条数据,如图15、图16所示。023数林标杆■图15杭州市开放的“公交车辆GPS信息”数据集■图16杭州市开放的“公交车辆GPS信息”数据集部分内容截图024数林标杆淮北市开放的“公交点位”数据集中,详细提供了公交车辆实时位置数据,包括车牌、经纬度、时间、站点、线路等重要字段,如图17、图18所示。■图17淮北市开放的“公交点位”数据集■图18淮北市开放的“公交点位”数据集部分内容截图025数林标杆山东省开放的“省内网约车车辆基本信息表”数据集中,详细提供了公司、车辆所在城市、车辆号码、颜色、型号、车辆运输证、定位装置等详细字段,如图19、图20所示。■图19山东省开放的“省内网约车车辆基本信息表”数据集026数林标杆■图20山东省开放的“省内网约车车辆基本信息表”数据集数据项027数林标杆■图21浙江省开放的“企业或者车辆风险预警信息”数据集浙江省开放的“企业或者车辆风险预警信息”数据集详细提供了浙江省散装水泥专用车辆公司基本信息与发生违章、事故的数量等信息,包括车牌号、企业名称、企业社会信用代码、城市、违章数量、超速数量、受伤、死亡、出险数量等详细字段,如图21、图22所示。028数林标杆2.2优质APIAPI接口适用于提供实时动态的高容量数据,以促进高价值数据的开放与利用。优质API接口需要满足接口可调用、至少每日更新、数据集容量高等标准。目前,浙江省与杭州市平台提供了交通运输领域数据的优质API接口,如表7所示,图23和图24是通过接口获取的数据集的部分截图。■表7交通运输领域数据优质API■图22浙江省开放的“企业或者车辆风险预警信息”数据集部分内容截图029数林标杆■图23浙江省商务厅开放的“车辆出险数据信息”部分内容截图■图24杭州市余杭区开放的“公交车辆GPS信息”部分内容截图030数林标杆■表8各地开放的交通运输领域10类常见数据集《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》第九章提到要“聚焦新一代信息技术、生物技术、新能源、新材料、高端装备、新能源汽车、绿色环保以及航空航天、海洋装备等战略性新兴产业,加快关键核心技术创新应用,增强要素保障能力,培育壮大产业发展新动能。”新能源汽车相关数据是保障新能源汽车产业发展的重要数据要素。因此,报告还重点分析了当前国内各地方开放的新能源汽车相关数据集,主要以新能源公交车的车辆与运营数据、充电桩数据、车辆保险出险三种类型为主(如表9、10、11所示)。除了有利于新能源汽车产业的发展,这类数据也有利于保险行业针对新能源汽车发展开发适合的保险产品。然而,目前新能源汽车相关的开放数据集呈现为静态低频、数据容量整体较低的特征,还无法满足相关产业发展的需求。3.常见数据集报告将各地开放的交通运输数据集的名称进行文本分析,出现次数最高的关键词有运输、道路、车辆、证、船舶、从业人员、客运、站点等。结合各地实际开放情况,报告归纳出各地开放的交通运输领域10类常见数据集,如表8所示。031数林标杆■表9国内各地方开放的新能源车辆与运行情况数据一览表■表10国内各地方开放的新能源车充电桩数据集一览表032数林标杆■表11国内各地方开放的车辆保险与风险数据一览表4.授权运营数据集青岛市公共数据服务平台以数据开放和授权运营的形式开放了136个交通出行领域数据集,并将数据分为三个等级,分别对应无条件开放、有条件开放与授权运营。截至2023年5月12日,平台用户发布了26条交通出行领域的需求,以征集产品与解决方案,同时提供了121条交通出行领域数据服务,包括数据模型、算法服务与解决方案三种形式,如图25-图27所示。033数林标杆■图25青岛市公共数据服务平台首页■图26青岛市公共数据服务平台数据资源栏目(交通出行)034数林标杆■图27青岛市公共数据服务平台数据服务栏目(交通出行)(三)利用层各地为了促进交通运输领域的开放数据利用,开展了一系列利用促进活动,例如组织交通领域的行业小赛,在开放数据创新利用大赛中设置交通运输赛道赛题等,产出了一定数量的利用成果。这些利用成果主要覆盖了公交出行规划、停车场查询、交通政务服务、外卖配送、公路客运、公路货运、交通便利度评测、驾车路线规划、新能源充电桩查询、物流配送、航线查询等11个应用场景,其中,公交出行规划、停车场查询场景的成果数量最多,占全部利用成果的九成。利用成果的场景覆盖与典型示例如表12所示。035数林标杆报告对各地在交通运输领域的利用促进活动与利用成果进行了比较分析,在比赛举办、服务应用质量、创新方案质量、成果价值等方面筛选出部分标杆案例。■表12交通运输领域利用成果覆盖的应用场景1、胶东五市联合举办交通数据开放比赛青岛市联合烟台市、潍坊市、威海市、日照市四个城市,共同举办了第一届”畅联杯“胶东五市交通运输科技创新应用大赛,如图28所示。该比赛以”低碳绿色智慧、协同创新发展“为主题,设置了绿色交通研究与应用、智慧交通研究与应用、交通产业园区概念设计研究与应用三条赛道。参赛者可以利用五个城市开放的公共数据,为解决公路、水运、轨道交通、航空、城市交通等领域相关问题提供创新方案。036数林标杆■图28第一届”畅联杯“胶东五市交通运输科技创新应用大赛037数林标杆■图29山东省的“腾讯地图(停车场模块)”2、腾讯地图利用山东省开放数据,帮助民众查询周边停车场山东省平台展示的腾讯地图(停车场模块)是嵌入在地图导航应用中的业务板块,帮助民众解决找车位问题,如图29所示。该应用通过调用山东省开放的机关事业单位停车场信息,为民众提供周边停车位查询功能,方便民众生活出行。3、杭州市开放实时公交位置数据,支撑应用公交到站查询功能杭州市开放了实时公交位置数据,以支撑市场应用的公交出行规划功能。市民可以在导航地图应用中查询公交的实时位置与预计到站时间,更为高效地规划出行,如图30所示。038数林标杆■图30杭州市地图应用可查询实时公交位置039数林标杆4、烟台市应用“e车易行”利用充电桩数据,鼓励用户将共享汽车停放在充电站烟台市的”e车易行“应用提供新能源汽车共享出行服务,如图31所示。该应用通过利用平台开放的充电桩数据,鼓励用户将汽车停放在充电站,以节约运营成本与提高新能源汽车利用效率。■图31烟台市”e车易行“应用利用平台开放的充电桩数据040数林标杆■图32湖州市创新方案“车路协同云服务平台”5、湖州市创新方案“车路协同云服务平台”,搭建自动驾驶仿真测试场景“车路协同云服务平台”是2022浙江数据开放创新应用大赛的一等奖项目,如图32所示。该项目通过智能交通体系产生的真实交通数据,同时结合政府开放的高精地图、红绿灯等数据,在满足数据合规的前提下,为自动驾驶公司提供更真实、更丰富的仿真测试场景,助力相关企业进行算法的优化和提升。041数林标杆■图33上海市交通数据授权运营产品“城市智慧泊车”6、上海市交通数据授权运营产品“城市智慧泊车”,支撑停车类应用“城市智慧泊车”是上海市交通公共数据运营主体“随申行”推出的数据产品。该产品对上海市公共停车场信息进行清洗和进一步加工,旨在面向地图商、导航软件提供商、停车服务商等用户,提供停车场的位置信息与可用泊位空余度查询服务,如图33所示。042国外案例五、交运数据开放国外案例1.数据层(1)美国特拉华州开放交通事故数据美国特拉华州数据开放平台(链接:https://data.delaware.gov/)通过门户开放该州发生自2009以来到半年以前的交通事故数据,如图34所示,数据来源于该州DSHS部门公开发布的事故报告,共有45万行,37个数据项,包括事故时间、照明条件、事故类型与说明、是否撞到行人、车辆撞击位置、是否酒驾吸毒等事故相关信息,但不包含个人信息。该数据每月更新一次,开放给社会利用,有助于识别、评估或规划潜在事故现场、危险道路条件,增强铁路-公路交叉口的安全。该数据集的描述说明非常丰富,如图35和图36所示,除了提供了丰富的元数据,还提供了数据字典,并在字典中以较多篇幅详细说明每个数据项的内容,帮助用户理解数据内容与相关背景信息,对数据利用者十分友好。■图34美国特拉华州数据开放平台开放“交通事故”数据043国外案例■图35数据集的元数据描述内容■图36-1数据字典中对数据项内容的详细说明044国外案例■图36-2数据字典中对数据项内容的详细说明(2)美国芝加哥市开放出租车行程数据芝加哥市数据开放平台(链接:https://data.cityofchicago.org/)开放了2亿多条出租车行程数据,平台将出租车车牌号隐去,用经过处理的出租车ID来对应,保护了隐私,却不影响数据分析利用。该数据包含了23个数据项,如行程编号、出租车识别码、出租车公司、行程开始时间、行程结束时间、行程开始的位置、行程结束的位置、票价、收费、付费类型等关键信息。下载该数据集后,其CSV文件大小达55.4GB,如图37、图38所示。045国外案例■图37芝加哥数据开放平台开放的出租车行程数据046国外案例■图38出租车行程数据部分内容预览(3)芝加哥交通管理局开放公交车实时位置数据接口芝加哥交通管理部门(CTA)(链接:https://www.transitchicago.com/data/)在官方网站的开放数据栏目中开放了各类公交实时位置数据,这些数据由公交车辆上的列车跟踪器采集并实时上传到CTA系统,而这些接口将从CTA中调用每分钟更新一次的数据,如公交车跟踪器接口提供了公交车所在位置、路线、服务状态、到达下一站的预估时间等信息,开发者依据接口详细的使用说明接入数据,可以方便的在所需应用中调用实时数据,如图39所示。网站还提供了列车跟踪器的数据,以及公交车站、路线、停车场等其他相关数据,接口申请便捷,使用说明非常详尽,如图40所示。047国外案例■图39芝加哥交通部门提供了各类公交实时数据接口获取方式048国外案例■图40芝加哥交通部门提供了各类公交实时数据接口使用说明049国外案例(4)荷兰国家道路交通数据门户开放实时数据,支撑交通规划应用荷兰从2020年开始以国家道路交通数据门户(如图41所示,http://opendata.ndw.nu/)向社会开放交通领域采集的实时数据,平台汇聚国内各地方交通领域供应商提供的数据并在提升质量后开放给社会。平台提供了道路管制数据服务,对道路工程和临时交通措施等可能导致交通延误的事件数据进行开放,该数据的供应商也以数据可视化形式开放了该数据。如图42所示,网站既能够提供原始数据的下载,也提供了管制路段的位置、管制原因、起始时间、预计延误时间等信息查询服务,从而既能够支撑技术企业开发交通规划应用,也能为司机提供实时交通信息与未来道路流量预测,避开拥堵路段。这些数据同时也在荷兰政府开放数据门户(https://data.overheid.nl/community/organization/ndw)以及欧盟开放数据门户(https://data.europa.eu/en)上开放。■图41荷兰国家道路交通数据门户050国外案例(5)优步开放城市行程时间数据集优步的开放数据集(链接:https://movement.uber.com/?lang=en-US)是一个基于优步的出行数据提供的城市规划工具。它可以让用户下载和分析超过700个城市的历史出行数据,包括行程时间、路线选择、交通流量等方面。图43是优步阿姆斯特丹城市行程数据的可视化交互分析与原始数据获取功能,用户在选择城市后会进入这样的地图交互的可视化工具,在地图上选择两个位置后,能够自动计算不同时期这两个位置行程所需时间;用户也能够下载该城市所有行程数据,图44是该数据部分内容预览,可以看到数据包含该城市各区块ID之间的平均行程时间。这些数据都是匿名化的,并符合开放标准,可以方便地与其他城市规划工具集进行整合。用户可以利用这些数据来了解城市的出行模式和趋势,帮助改善城市的交通状况和基础设施。这些开放数据来自私营企业,并提供了智能平台与交互分析工具,便于用户进行开发与增值利用。■图42荷兰国家道路交通数据门户开放的道路管制数据051国外案例■图43优步开放数据集中阿姆斯特丹城市行程数据获取■图44优步开放数据集中阿姆斯特丹城市行程数据部分内容截图052国外案例(6)欧盟开放数据门户开放来自企业的共享单车使用数据欧盟开放数据门户(https://data.europa.eu/en)开放了国际、欧盟、国家、区域、本地和地理数据门户的数据。平台开放了都柏林市共享电动自行车的使用数据,该数据提供接口并每5分钟更新一次数据,接口由运营公司提供,调用方式简易;同时将历史数据集以CSV文件提供下载,历史数据集以30分钟颗粒度提供数据。这些开放数据来自于私营企业,更新频率高,接口调用方便,如图45所示。■图45共享单车使用数据053国外案例2.利用层(1)西雅图A/BStreet游戏,模拟优化城市交通运行方案A/BStreet是一款模拟城市交通运行的游戏,玩家们可以自行编辑车道和十字路口的设计以改善交通流,游戏中的方案可用于提升现实中的交通政策,如图46所示。该游戏利用西雅图开放的真实交通基础设施数据,包括人行道、转弯车道、停车场、交通信号灯等,并模拟汽车、自行车、公共汽车和行人穿过。玩家可以重新分配现有道路空间(例如将一般车道转换为公交专用道)并编辑十字路口信号灯,然后运行详细的对比测试以探索其对所有人的影响。该应用还尝试基于人口统计数据生成交通需求模型,将游戏方案扩展到西雅图以外的更多城市。帮助用户理解数据内容与相关背景信息,对数据利用者十分友好。■图46A/BStreet模拟城市交通状况054国外案例(2)欧盟QROWD项目融合利用多源数据,减少交通拥堵为了治理交通拥堵问题,更好地规划和管理城市交通,欧盟的QROWD项目提供了一个平台来设计城市的交通和移动服务,并收集服务数据,与市民、游客、城市规划者交流互动,如图47所示。该平台在意大利特伦托市进行了试点,通过利用政府部门的开放数据,包括地理、交通、气象、人群、基础设施和公共交通等,并收集公众的需求信息,对城市交通状况进行预测并提供改善建议。■图47欧盟QROWD项目055国外案例(3)伦敦交通局建设开放数据技术论坛,与开发者进行互动交流伦敦交通局(TfL)针对交通开放数据利用建设运营了一个技术论坛,如图48所示。数据提供方可以在论坛中开放最新事件与数据集,开发者可以在论坛中分享使用开放数据的创新方案与改进建议,以及发布和解答有关数据本身和如何使用开放数据的问题。■图48伦敦交通局的开放数据技术论坛056国外案例3.准备度(1)美国运输统计局通过立法推动交通运输数据开放美国运输统计局(BTS)负责汇编、分析和发布各类交通领域的统计数据,上线了数据开放平台(data.BTS.gov),要求交通数据是可发现的、可获取的、可用的和可分享的,如图49所示。链接:https://www.bts.gov/learn-about-bts-and-our-work/bts-open-data-platform■图49美国运输统计局(BTS)官网057国外案例■图50《基础设施投资和就业法案》内容除了满足交通部的需求外,美国运输统计局还立法要求美国运输统计局服务于整个运输界,明确包括州和地方政府、私营企业和公众等不同需求的客户。《基础设施投资和就业法案》将对致力于向公众开放共享数据的项目给予更多支持,如图50所示。058国外案例(2)欧洲铁路工业联盟将数据开放列入未来技术发展方向欧洲铁路工业联盟(UNIFE)2020年发表《适应数字时代的铁路》报告,提出了包括数据开放在内的多个未来技术发展方向。其中数据开放这一发展方向重点强调在数据生产者和数据使用者之间分享信息,在此基础上探索大数据分析不断上升的潜力,通过开放数据有助于预测资产情况、提高风险诊断能力和运维工作的预见性以及优化能源使用效率,如图51所示。■图51欧洲铁路工业联盟发表的《适应数字时代的铁路》报告059国外案例(3)美国公路和运输官员协会战略管理委员会将数据开放作为核心数据原则美国公路和运输官员协会(AASHTO)数据管理和分析委员会提出了一套核心数据原则,指出数据应该是开放的、可获取的、透明以及可共享的,如图52所示。报告指出,由于运输组织与众多的利益相关者和外部伙伴合作,所以与他们共享数据是十分必要的。当所有现存的电子数据都能以电子方式分享并得到再利用,将有助于效率的提升,解除对交通数据的保护将比过度保护他们带来更多效益。■图52美国公路和运输官员协会(AASHTO)战略管理委员会及其核心原则060国外案例(4)新加坡智慧国家2025计划为交通领域数据开放提供指南新加坡政府制定了“智慧国”国家战略,以推动和促进整个新加坡采用数字和智能技术,其中着重强调了开放数据战略,推动公共机构收集的数据集通过在线门户向公众开放访问,使开发人员可以轻松地共同创建数字解决方案以造福社会。计划提出了一系列倡议,其中着重将运输作为重要版块专门列出,在交通领域发布了城市交通开放数据与分析(OpenData&AnalyticsForUrbanTransportation)的文件,指出要开放城市交通数据,比如公共汽车实时到达时间、出租车可用性、交通状况、停车场空闲率等,使得公众或第三方开发人员可以利用这些信息,服务于创建更高效的交通解决方案的总目标,如图53所示。■图53新加坡智慧城市战略061六、交运数林建言数林建言1.准备度在开放利用要求方面,建议各地相关法规政策中对交通领域的数据开放范围、数据动态更新、数据获取无歧视、需求与回应、省市协同推进作出要求。在全生命周期安全管理方面,建议各地相关法规政策中对交通领域数据开放全生命周期的安全管理作出要求,并对社会主体的权益保护以及申诉机制、渠道作出要求。在保障机制方面,建议各地相关法规政策中对交通领域数据开放工作的人员能力保障、资金保障、职责分工作出要求。2.数据层在数据数量方面,建议各地持续开放更多高价值交通运输数据集,重点提升数据容量,提高单个数据集的容量,提供更多以API接口形式开放的、动态的、高容量数据。在开放范围方面,建议参照报告中的“常见数据集”清单开放各地已普遍开放的交通运输领域数据,参照国内外优秀案例,扩大交通运输领域数据的开放范围。在数据质量方面,建议各地开放更多实时动态的交通运输数据,而不只是开放静态的数据集,甚至是颗粒度很低的统计数据。建议清理高缺失、碎片化、容量极低的数据集,并保障开放数据集的动态更新。在数据规范方面,建议推进交通运输数据的分级分类开放,并配备相应的、差异化的开放授权协议。提高可机读、非专属与RDF格式的数据比例,降低申请和调用API接口的难度,为开放数据集提供丰富的元数据说明。062数林建言3.利用层通过数据需求征集、利用试点项目等举措促进交通运输数据的供需对接,产出更多优质利用成果。在开放数据大赛中设置交通运输相关的赛道赛题,吸引和鼓励社会更多参与交通运输数据的利用。重点开放实时公交位置、停车场信息等数据,支撑出行类应用提供公交规划、停车导航等服务,改善民众的交通出行体验,充分释放交通运输数据的社会经济价值。推进道路基础设施、交通流量、充电站等数据开放,助力新能源汽车、自动驾驶等新兴产业发展。063七、交运数林指数评估方法评估方法1.评估范围根据公开报道,以及使用“数据+开放”“数据+公开”“公共+数据”“政务+数据”“政府+数据”“地名+数据”“地名+政府数据”“地名+开放数据”等关键词进行搜索,发现了截至2022年10月我国已上线的相关国家部委和地方政府数据开放平台,并从中筛选出符合以下条件的平台:(1)平台由行政级别为地级以上的政府建设和运营(不包括港澳台)。(2)开放形式为开设专门、统一的数据开放平台,由地方条线部门单独建设的开放数据平台不在评估范围内。(3)平台上确实开放了电子格式、可通过下载或接口形式获取、结构化的交通运输领域数据集。本次评估中,共发现符合以上条件的国家级交通运输数据开放平台2个(如表13所示);符合以上条件的省级平台21个(如表14所示);符合以上条件的城市187个(如表15所示)。报告将上线了这些平台的国家部委、省域和城市作为评估对象,研究我国交通运输领域公共数据开放的情况。064评估方法■表13国家级交通运输数据开放平台■表14省级评估范围(按拼音首字母排序)065评估方法■表15城市评估范围(按行政层级及拼音首字母排序)066评估方法067评估方法068评估方法2.数据采集与分析方法准备度评估主要对交通运输领域公共数据开放的法律法规与政策文件、标准规范等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在搜索引擎以关键词检索相关法律法规、政策文件、标准规文本;二是在相关国家部委和地方政府门户网站、政府数据开放平台、行业信息标准规范平台、地方标准信息服务平台以及相关法律法规数据库,通过人工观察和关键词检索采集数据。数据采集截止时间为2022年11月。数据层评估主要通过机器自动抓取和处理相关国家部委和各地政府数据开放平台上开放的数据,结合人工观察采集相关信息,然后对数据进行了描述性统计分析和文本分析。数据采集截止时间为2022年11月,采集范围为国家部委和各地政府数据开放平台上交通出行、交通运输等主题下各政府部门和企事业单位开放的相关数据,其中政府部门主要包括交通运输、公安、自然资源、海事等,企事业单位主要包括公交公司、城投、空港、轨道集团等。利用层评估主要对相关国家部委和各地政府数据开放平台上展示的利用成果进行了人工观察和测试,对2020年以来相关国家部委和各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计析。数据采集截止时间为2022年11月。069交通运输领域开放数林指数603010评估方法3.指数计算方法指数出品方基于各地在各项评估指标上的实际表现从低到高按照0-5分共6档分值进行评分,其中5分为最高分,相应数据缺失或完全不符合标准则分值为0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为0-5分之间的数值作为该项得分。各地平台在准备度、数据层、利用层三个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、数据层指数、利用层指数乘以相应权重的加权平均分。基于各地的最终指数得分与排名,确定综合等级。各地开放数林指数计算公式如下:070指数制作团队报告校对组观察员郑磊、刘新萍、张忻璐、吕文增、华蕊、张宏、侯铖铖、王宇景胡业飞、王翔、马李滨、韩笑董万怡梦、李行行、林志文、王潇睿、肖姝阳、辛悦、尹江方指数制作方附录071联合发布方072支持单位合作单位冥睿(上海)信息科技有限公司中山大学数字治理研究中心晴禾(南京)文化有限公司律商联讯(北京)信息技术有限公司

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

碳中和
已认证
内容提供者

碳中和

确认删除?
回到顶部
微信客服
  • 管理员微信
QQ客服
  • QQ客服点击这里给我发消息
客服邮箱