基于关联数据的政府数据发布

论文核心提示:

 关联数据提供了关联结构化数据的新媒介,可以让机器更好地理解和读取这些数据。但关联数据本身不会给信息增加任何语义含义,只是更好地携带和展示语义数据供用户访问。所以,关联数据虽然本身并不具备语义特征,但它可以在数据层面建立关联,为真正的语义网铺平道路。政府数据作为网络的权威数据源,通过关联数据发布,将有助于相关信息更好地服务于社会和大众

  [摘要]采用关联数据标准来发布政府数据,可以提高政府数据的透明度,提升政府数据的利用率。对政府数据利用关联数据标准进行发布的优势、途径和应用进行梳理,强调利用本体技术,将各类术语体系,包括与政府运作有关的各类数据模型,开发规范成一个政府数据本体,可以使得数据更规范、更有关联,容易查找和利用。
  [关键词]关联数据 政府数据 语义网 本体 电子政务
  [分类号]G250
  政府数据是指一切产生于政府内部或虽然产生于政府外部,但对政府活动、公共事务和普通民众有影响、有意义的数据资源的统称…。随着互联网和语义网技术的发展,各国政府日益意识到基于开放标准在互联网上发布政府数据的重要性,然而语义网并非将数据上网这么简单,更多地需要考虑数据之间的关联和复用,从而使得机器能够理解并发现更多的相关数据。2008年6月,W3C组织的e-Government兴趣小组指出Open Government Data是其最主要的研究领域。2009年6月,李爵士(Tim Berners-Lee)发布了名为“将政府数据上网”的文章,邀请世界各国政府以关联数据为标准在网络上发布政府数据。2009年,英国和美国政府开始了关联数据的尝试,分别建立了data.gov.uk和Data.gov两个采用关联数据标准的政府数据网站。与此同时,在美国、欧洲和澳大利亚,一些相关的研究机构和网站也纷纷成立。
  1关联数据和政府数据发布
  政府数据上网主要是基于三个因素的考量:民众对政府职能和义务的需求增加;通过网络向世界提供有价值的信息;使得政府、组织更加高效地运作。这就使得政府数据在发布上必须能够在一定范围内最大限度地利用这些数据,从而优化政务流程,规范政府行为,优化政府结构,提升服务质量。传统的政府数据存在形式既有格式化的数据如CSV、XLS,也有非格式化的数据如PDF、HTML等。大量不具备语义的非格式化数据的存在,使要实现对分布、异构的政府数据进行共享和操作变得很困难。改变政府数据的组织和发布标准显得尤为重要。
  关联数据作为语义万维网第一种可行的表达方式,由李爵士在2006年提出。基于这一概念,通过规定4个简单的发布规则,所有的网络用户都可以进行自定义语义信息的发布。这4个原则是:①使用URI(统一资源标识符)作为任何事物的标识名称;②使用HTTP URI使任何人都可以访问这些标识名称;③当有人访问某个标识名称时,以标准的形式(如RDF、SPARQL)提供有用的信息;④尽可能提供相关的URI,以使人们可以发现更多的事物。
  简而言之,将现实世界的事物以URIS来进行标识,并以机读方式进行发布,其他数据集就可以以URIS的方式来互相指向。这样,人们不需要将信息拷贝到原始的数据集里面,就可以发现相关信息,实用且可操作,适用于各种形式的数据,能够满足政府数据发布的需求。从定义上来看,关联数据是一组语义网最佳实践的集合,它采用RDF数据模型,利用URI命名数据实体,来发布和部署实例数据和类数据,从而可以通过HTTP协议揭示并获取这些数据,同时强调这些数据的相互关联以及有利于人机理解的语境信息。使用关联数据标准来发布政府数据将有助于信息的公开、复用和传播。
  在关于关联数据的问答中,李爵士指出了关联数据为企业带来的种种关键性的益处,同时这些益处也成为企业采用关联数据的绝好理由,概述如下:①RDF模型可以同样地应用于非结构化、半结构化和结构化的数据与内容。②消除内部数据相互分隔的“仓储”(silos)。③整合内部和外部数据。④易于在企业、行业、开放订阅和开放数据之间进行连接。⑤对遗留模式的数据实现完全的模型化。⑥可以很容易地对现有模式进行灵活更新和变更。⑦不再需要因为商业模式的改变或者并购而重构遗留的数据模式。⑧基于模板和查询的报表创建和数据呈现,不再需要人工操作。⑨数据访问、分析和操作并推送到用户层。⑩采用现有的数据库管理程序和设施进行内部关联数据存储的能力。这些针对企业数据的优点,同样也适用于政府数据的发布。
  关联数据还具有如下优点:①开放:关联数据能够被各种各样的应用获取并使用,因为数据是以开放和非私有的格式发布的。②模块化:关联数据之间可以随意混搭,甚至可以和其他关联数据的不同片段进行混搭。比如,特定区域的关于医疗健康方面的政府数据,可以和该地区的人口、环境等数据联合起来,从而对政府医疗投入的效率进行评估。而且数据使用无需长期规划,只需要在本体方面进行规范即可。③可拓展性强:对关联数据进行增删比较容易,术语和定义所发生的变化,不会影响到数据本身。
  此外,关联数据所采用的RDF模型比其他数据模型具有更好的互联互通性能:①它使用URI作为唯一资源标识,可以用来链接任何事物和概念。②它允许不同的系统独立设计并在最终的边界联合起来。③它具备良好的低成本的互操作性。④它允许所有数据以混合词表的方式进行表达。这就意味着无论人们想要的政府数据是以什么格本文世纪论文网(www.21cnlunwen.com)提供式发布的,或以什么数据格式保存并获取,人们都可以使用关联数据标准来进行发布,通过使用RDF模型作为中介,使这些数据互联互通起来。2政府数据的关联数据实现
  关联数据建立在现有本体论(ontologies,如Word—Net、FOAF、SKOS等)之上,并和本体论相互关联。数据集授权访问自己的知识库,并且连接到其他数据集的内容。这些数据集内的知识库都可以被访问,并和其他数据集的内容连接在一起。以关联数据发布政府数据(原生政府数据以及与公共管理相关的信息),其核心在于标识和发展一套本体模型和实践指南,从而帮助政府实现关联数据发布。而这一问题的关键点就在于通过将各类术语体系,包括与政府运作有关的各类数据模型整合,将其开发规范成一个政府数据本体,从而使得政府数据更规范,更有关联,容易查找。
  政府数据覆盖众多部门、机构、团体,各自行使着不同的行政职能。这些部门之间相对独立(例如农业、卫生、税务、教育等部门),各自使用的系统和数据格式也各有不同,各自构建的数据资源具有很高的自治性。这些部门出于各种关系和目的,经常需要进行不同数据源之间的数据交换操作,即使在部门内部,业务系统升级或数据结构需求等变化,也需要进行数据转换的操作。要实现这些数据转换,仅仅对数据源进行物理层面上的连接是不够的,还需要建立逻辑上的连接,以完成系统中数据结构与数据语义的完整交换。要实现这些分布、异构数据资源的共享和互操作,就需要建立一个基于多本体的核心政府元数据集。  

图书馆管理系统论文快速发表服务   本中心提供图书馆管理系统论文发表服务论文推荐发表,论文指导服务 专业水准,发表全程跟中服务,。
期刊类别多杂志期刊都发表,省部级、国家级、核心期刊、EI、会议的职称论文发表。
王编辑 : “王编辑QQ”:375623535   张编辑 : 张编辑QQ在线:812445863

文章类型:图书馆管理系统论文发表及相关期刊推荐

更多

[本论文关键字]: