此次开放数据前沿专栏将聚焦于一个崭新的命题,数据基础设施(data infrastructure)。数据基础设施是开放数据议题下更为底层也更为宏观的一个命题,我们如何确保服务于社会运作的基本数据得到开放并确保我们拥有其所有权?此篇专栏整合了来自英国开放数据研究院(ODI)的两份文件内容。第一份是其写给英国基础设施建设委员会主席的公开信,作为序言引出数据基础设施的重要性和迫切性。而第二份文件则是ODI所编写的宣传册《Who owns our data infrastructure》,向读者更为细致的诠释数据基础设施的含义。
◆ ◆ ◆
序言
一封给基础设施建设委员会主席的公开信
亲爱的Lord Adonis:我们强烈建议基础设施建设委员会将数据视为现代社会及其经济运作的根本基础设施。
◆ ◆ ◆
数据是基础设施
数据是一种基础设施。它是透明度、问责制、公共服务、业务创新和公民社会的基础。无论是统计数据、地图数据还是实时传感数据,都是帮助我们开展决策、构建服务并获取洞见的重要基础资源。其可来自于数据光谱中封闭数据、共享数据、开放数据的任何一段。
数据的价值来自于我们对数据的应用。在过去几十年中,我们对数据的应用有了显著的增长,而因此数据所能发挥的价值也越大。其不仅体现在移动应用数量的增长之上,也体现在农业生产力的提高、运输网络的高效利用和互联数字经济的发展之上。
开放数据有着很强的的经济价值。据估计,仅在公共部门中,开放数据所创造的价值就占到了0.4%和1.5%的GDP之间。而随着更多组织和部门加入开放数据大军,则其经济价值将越发凸显。在英国皇家统计协会的数据宣言中就指出,开放数据是社会发展所依赖的核心参考数据,同时其也是释放其他数据集经济价值的催化剂。英国虽然已经走在开放数据和数字经济的世界前沿,但我们应当加快发展进程从而保持领先优势。
◆ ◆ ◆
我们应当即可强化英国的数据基础设施
经济合作与发展组织(OECD)近日评论道:“像道路和桥梁这些实体基础设施所带来的效益是不可预期且往往具有“溢出效应”的。比如说道路和桥梁的修建便能促进贸易和社交往来,从而通过贸易和社交带来远超原本道路和桥梁自身的效益。。而提高对数据的访问性,也有同样的“溢出效应”。通过数据利用者对数据的加值利用,将能为我们的社会提供重大发展机会,或为整个社会创造出数据采集时绝无预期的效益。。
数据联通着不同行业。在英国,无论是农民,还是交通运输从业者,又或是普通市民,都是英国气象局所发布的开放气象数据的使用者。而英国国家地图测绘机构(简称OS)所发布的地图数据,则也得到包括谷歌、建筑公司和房屋保险公司等在内各类利用者的加值利用。因此,数据作为我们城市和国家的一种基础设施,联通着我们每一个行业。
建立完善的数据基础设施对我们有着诸多的要求。不仅需要我们加强将数据视为资产的管理能力,也需要加强我们本身对数据资产所有机构的管理经营能力,同时也需要制定使用、管理和保护数据的规范。当然在我们面向所有人开放提供那些应当开放的数据时,我们也需要保护那些需要保持私密的数据。唯有兼顾开放和隐私,才能建立信任关系。
这已非简单的数据科学问题,而是事关整个社会的数据素养。无论是城市居民和社会团体,还是商业机构;无论是首席执行官还是律师、会计和程序员等专业人员;无论是政客和决策者,还是一线公务人员;数据素养都与社会的每一个人有关。
如今,我们尚未将数据视作基础设施。尽管我们从工业革命到现在,都十分重视道路、地铁和能源网络,但我们并没有给予数据同样的重视。我们贸然无视了数据作为推动效率和社会发展的引擎作用,而仅仅将其视作透明化的工具。因此,是时候去强化我们的数据基础设施了。
◆ ◆ ◆
数据基础设施将成为21世纪的竞争优势
强化数据基础设施要去整个经济社会中的个体和组织进行技术和文化的转型。我们必须更善于处理复杂的社会问题,例如数据隐私问题,学会如何保证数据安全,健全资助模式以支持数据的加值利用,并设计新的运营模式。
我们所构建的数据基础设施能帮助我们更好的利用数据,并从中获得更多价值。消费者将对社会服务,无论是金融服务还是零售服务,有更多信心;数字商业将能更快地创新,从而创造更好更新的服务;农场和工厂的效率将得到提升,并变得环境友好;城市将充分利用道路和能源网络,从而变得更加适宜居住;市民能够享受更好的教育和医疗;民主进程也将随着政府的持续开放而得到改善。
建立最佳和最开放的数据基础设施,将使得城市,国家,乃至大陆在21世纪经济发展中具备巨大的优势。
数据基础设施应当如同我们的道路,铁轨和能源网络一样,为社会公益而得到建设维护。
我们诚挚希望将有机会同基础建设委员会详细讨论这些想法。
祝好,
Hetan Shah, 执行董事, 英国皇家统计学会
Gavin Starks, 首席执行官, 英国开放数据研究院
◆ ◆ ◆
1.如何建立数据网络的基础?
万维网让我们以未曾想象过的方式相连。通过网络,国家能迅速应对市民、目标资源、贸易出口和服务的需求。在国际市场中,万维网使得无数的群体得以聚集起来,交流想法,共同实现创新。
如同铁路基础设施的建设,不同的团体需要共同参与并努力协作,才能够充分释放数据网络的价值。有些人视数据为“新石油”,认为其能够加速经济增长,并改善服务;有些人则认为数据是同更为透明的政府间建立信任的一种方式;而有些人认为在接下来的25年中,万维网从链接文件变为链接数据,因此其影响将远超过去25年所达到的。但是数据资产并非突然出现。我们并非“发现”数据并从其获取价值。相反,我们是创造并维护数据,并通过分享数据来增加其价值。
无论是交通,能源,教育和健康等行业的数据,还是作为关联地理位置的地图或地址数据,都是一个社会完善运行的必须品。数据就像交通工具一样,能够帮助你到达你需要去的地方:无论是收货新的发现,还是获得新的洞见,无论是提供更好的服务或仅仅是获得更多关于你所生活社区的信息。
政府、商业和社区对于必要的实体基础设施——高速公路、电线、河道和宽带连接——都做了极为仔细的规划。而如今,对于数据,我们应该采取同样的方式,来计划和构建数据基础设施。
当我们构建数据基础设施时,我们必须考虑一些重要的问题:隐私究竟意味着什么?哪些
数据可以被合理出售获取利润,哪些数据又应当为社会公益而提供给所有人?在我们尽量最大化释放数据价值的同时,我们如何减少数字鸿沟?
◆ ◆ ◆
2.数据所有权如何塑造我们的未来
数据作为政务的核心有着悠久的历史。在古希腊迈锡尼文明时期(公元前1600年至公元前1100年),书记员就以一种今天我们称之为“线性文字B”的文字记录下政务数据。在当时,这些数据由国家掌控,只有极少人可以接触到。
而随着科技和社会习惯的转变,我们收集、保存和分享数据的方式也变得更加多样。。
我们如今还是有目的性地通过问卷和人口普查之类的方式来收集数据,但有些数据则是作为公共服务和私营服务的副产品而被创建的。在一个数字化的时代,所有的产品和服务都能产生对某些人有用的数据。
而和我们的实体基础设施一样,重要的数据也通常由不同的群体所有和管理。
在有的国家,实体基础设施为政府所有,政府可以管控它们的使用。而在其他国家,实体基础设施则由控股收费公路、航空以及铁路运输的公司所共同管控。在这种混合的模式下,政府通常会出台相关的政策和法规,以保证这些公共设施能够真正地为民所用。
数据基础设施存在的目的,就是让重要的数据可以尽可能地被人们获取和使用。
数据基础设施可以帮助我们辨别出那些对社会正常运转有重要意义的数据。通过这样的方式,数据的质量和可访问性都可以得到保证,进而为社会团体正向所用。
如今的组织——不论是政府还是企业——都可以拥有数据宝藏。这些宝藏对于它们而言是非常有价值的:它可以揭示这个组织的运作方式。但是就如同某些实体基础设施一样,这些数据对于其他更多的团体而言也同样具有巨大价值。
例如,对手机数据的汇总分析可以揭示人流是如何增长、收缩和变化的。电话公司利用它们来定位无线电发射桅杆的位置。但如果这些数据可以被其他组织团体访问,那么零售商就可以利用它们来优化店面的选址地点和营业时间。政府也可以利用它来做应急响应预案,慈善团体也可以利用这些数据来确定他们的目标人群。
在某些情境下,上述有价值的数据可能会被出售。出售数据对于公共部门、私有企业、非盈利组织而言都是有利可图的。在其他的一些情况下,企业或政府也会选择开放数据,来让所有人访问、使用和分享这些数据,挖掘出这些数据中蕴藏的更大价值,带来更广泛的社会效益。但是否授权公众访问这些数据则取决于其所有者。
◆ ◆ ◆
3.我们如何定义“数据基础设施”
交通、能源和医疗健康方面的实体基础设施,能够让我们吃得饱、穿得暖、生活得更加美好,而数据基础设施则能让我们更加明智。
数据基础设施遴选出那些为重要服务、产品和研究提供支撑的数据。通过便捷化数据获取,并提供战略框架完善数据管理,数据基础设施能够帮助社会更优化地运转。
数据基础设施是由来自不同组织团体的数据构建而成——这些数据可能会是封闭数据,可能是流通于特定组织团体间的共享数据,也可能是经过开放授权了的开放数据;而数据拥有者则也横跨政府,企业和非营利组织。
数据基础设施帮助我们识别出那些具有社会价值、环境价值和经济价值的数据,并通过让这些数据最大程度的方便访问和使用,来释放这些价值。
一些国家已经开始筹划他们的数据基础设施。 2012年,丹麦政府提出了基础登记记录(Basic Registries)的发展路线图,基础登记记录包括了所有跨部门服务必要的数据。而自2013年起,英国政府也已经开始了对建设国家信息基础设施(NII)的讨论。
我们需要从本地化、国家和全球三个层面,深入探讨数据基础设施:
本地化的数据基础设施
在本地化层面上,数据基础设施能够让市民、社区成员和地方政府决策者更加明智,进而让我们的城市变的更加智慧,加快智慧城市的发展步伐。
国家级数据基础设施
在国家层面上,数据基础设施能够帮助各国建立经济、社会和环境的应变能力。基于此,政府和企业能够给公民提供更丰富的服务,并开发出公民所需的个性化产品。同时,这些方面的透明化也将增强一个国家的民主参与度,并推动问责制的发展。
全球级数据基础设施
在全球层面上,数据基础设施能够帮助我们很好的应对全球化的挑战。它能帮助我们监控跨国组织,也能让我们在有助于衡量国际政策进度的比较统计学上达成一致。
数据基础设施的定义要求我们能够确保重要数据是可访问的,并能得到广泛的应用。但我们该如何保证呢?
让数据开放:确保数据的授权协议允许任何人访问、使用和分享这些数据;
让数据可用:通过政策或法规来促进数据的可访问性,即使需要收取一定费用;
责任制管理:确保那些管理数据基础设施的组织,能够对数据的可访问性和可重用性负责。
◆ ◆ ◆
4.我们期望管理数据的组织团体做哪些工作
我们对掌管数据资产的组织团体的信任基于如下三方面的判断:这些组织收集的数据类型、他们收集数据的理由及其组织性质。
当我们认为数据是一个社会正常运作的基础时,我们会期待那些拥有和管理数据的组织做些什么呢?
在研究了政府部门、非营利组织、私营公司和慈善机构等不同的信息所有者之后,一些规范核心数据资产管理的基本准则逐渐清晰了起来,它们是:
长期可持续性:具有持续的资金支持、管理支持和管理目标。组织应具备稳定性,且能长期管理数据。
权威性:组织应成为其所管理数据的可信且权威的来源。
透明性:组织应公开数据来源及如何处理和管理数据。同时,它应设有一定的相关机制,以便利益方询问和数据相关的问题(例如,公共部门组织可通过信息自由法来了解情况)。
开放性:组织应对用户开放,并且能够响应用户的要求,包括:组织内部和外部的用户、直接和间接用户,以及将数据用于已知用途和新用途的用户。组织应积极开放其运作机制,并尽可能地让用户方便获取数据。
保证数据的可用性:如果组织垄断了此类信息,它有权拒绝用户的数据访问请求,导致不正当竞争或者忽视数据质量,在这种情况下,该项准则将非常重要。如果组织持续提供高质量的数据,而使用的标准和格式又能确保持续可用性,就应受到褒奖。该奖励可能是财务激励(创收),或得到提供访问管理的授权(如通过立法),或一项社会荣誉。
敏捷性:在数据背景下,’敏捷性’有两层含义:实体应该能够让数据管理适应不断变化的社会和技术环境,并满足不断变化的用户需求;它也应当能够快速地更新数据,包括对外部反馈的响应。
原作者:英国开放数据研究院
授权协议:CC-BY-SA 4.0 国际
译者:王建嘉,汪羽婷,赵璇,谭学垒
主编:高丰
更多阅读: