您当前的位置:首页 >  述职报告 >  教师述职报告 > 内容

E-Science环境下科学数据的整合与共享

无忧文档网    时间: 2019-09-03 06:02:15     阅读:


  〔摘 要〕E-Science环境下科学数据实现共享的关键在于标准化,共享的前提是制定标准的规范;实现有效的科学数据整合,使地理分布无关的计算资源、数据资源、存贮资源的全球自动配置和共享。
  〔关键词〕E-Science;科学数据;整合与共享
  〔中图分类号〕G255 〔文献标识码〕B 〔文章编号〕1008-0821(2009)05-0128-03
  
  Integration and Resource Sharing of Scientific
  Data under E-science EnvironmentYao Songtao
  (Library,Henan University,Kaifeng 475000,China)
  〔Abstract〕The key of implementing scientific data sharing under e-science environment is standardization;scientific data should be integrated efficiently,so as to automatically allocate and share the computing resources,data resources,storage resource in the global range.
  〔Keywords〕e-science;scientific data;integration and sharing
  
  1 E-Science及其特点
  
  现代科学研究的问题空前复杂化,20世纪末产生了一种崭新的科研协作模式和大科学工程——E-Science。E-Science中文译法有“数字科研”、“电子科研”、“电子科学”、“科学研究信息化”,它是一种以网格为基础的新的科学研究环境。
  “E-Science”的概念是英国人先提出来的,它是建立在新一代网络技术(Internet)和广域分布式高性能计算环境(Grid)基础上的全新科学研究模式,以互联网技术和网格计算技术为基础,实现跨越地理界限的全球大规模数据采集、T级高速计算和高性能可视化,并以此为基础将互联网的应用、高性能科学计算及资源共享提高到一个全新的层次。在这种环境中,地理位置、分散的各种仪器设备、计算资源、数据资源等被虚拟的集成到一起,科研人员可以自由的使用各种资源,无需考虑资源的存储地和提供者,这种使用突破了时间、物理空间、逻辑空间上的障碍。
  E-Science具有如下特点:首先,E-Science是一种信息化的基础设施,它提供了一种信息化的科学研究环境和平台,使得不同学科领域的科研活动能够有针对地开发特定的科学研究与应用;其次,E-Science的建立应以应用需求为导向;另外,E-Science的实现需要大量的新技术,事实上E-Science正是20世纪后半期IP技术尤其是20世纪后10年IP技术的产物[1]。它所需要的最具代表性的是网格技术,正是通过网格才有可能将E-Science所需的众多技术与资源,如分布式计算技术、网络安全技术、协同工作技术、资源管理技术等等集成一体,构成并实现了E-Science。
  
  2 中外科学数据共享的现状
  
  2.1 国外科学数据共享的现状
  随着经济发展的全球化和全球性科技活动的不断增强,导致全球范围内的科技人员对科学数据信息资源的交流、互通和深度使用有强烈需求和高度依赖。近20年来,美国、俄罗斯、英国、法国、加拿大、日本和新加坡等发达国家相继颁布了有关科学数据信息共享的政策法规,开始实施科学数据共享工程。目前国际上实施科学数据共享主要体现在3个方面:第一,政府投入大量资金支持科学数据的长期积累、高效流动和低成本使用;第二,从法律、政策等多方面保障科学数据的管理与共享服务;第三,科学数据共享主要采用国家调控下的事业性运行模式。
  2.2 我国科学数据共享现状
  科学数据是科技活动的结晶,是科技发展与创新的基石,是国家安全和社会经济发展的重要保障。但科学数据共享却在我国长期以来没有得到应有的重视。
  具体说,我国科学数据的共享现状是:①目的单一,以自用、完成任务为主,只能为少数人使用,得不到及时的更新。②分散在各个单位、数据观测点、科学家个人手中,许多珍贵数据记录已因年久而损毁或散失。③无统一的数据规范标准,标准化程度很低,从根本上降低了数据共享的可能。④重复建设,浪费大量人力、物力和经费。
  国内虽然在科学数据共享方面的工作起步较晚,但是在国家科技部的领导下,近年来,在整合已有科学数据资源、推动科学数据共享方面作了大量卓有成效的奠基性工作,1999年,国家科技部基础司组织了“科学数据共享调研组”,并于2001年11月完成了“实施科学数据共享工程,增强国家科技创新能力”的调研报告。该报告在深入分析我国科学数据管理存在的问题和国际科学数据管理的经验基础上,提出了实施国有科学数据公益性共享的战略国策和10年建成科学数据共享保障体系的总体思路。现已开展国家科学数据共享工程的试点建设,这不仅为国家科学数据共享工程实施标准的制定和具体实施提供了技术基础,也为科学数据共享工程向其它领域延伸,向地方区域推广提供了宝贵经验。随着我国计算机网络技术的高速发展,网络带宽迅速扩大,信息技术开发能力的不断增强,必将促进我国科学数据共享的跨越式发展。
  
  3 E-Science环境下科学数据的整合与共享
  
  3.1 制定标准规范
  E-Science环境下从“全球数字图书馆”的角度来说,需要将众多的力量协调组织起来,实现网络的互联互通、资源的共建共享、管理的井然有序,来满足各个不同的科研团队的科研需要。实现共享的关键就在于标准化,共享的前提是制定标准的规范,统一的元数据标准能实现资源的互操作性,统一的标准化协议能使异构信息变同构信息。
  元数据是数字图书馆的语义基础,为数字图书馆提供完整的数据描述形式,为分布的、由多种数字化资源有机构成的信息体系提供规范、普遍的描述方法、整合工具和纽带,使广泛分布的数字图书馆资源站点具有充分的互操作性和可扩展性,提供数字图书馆中的资源描述、资源发现、资源处理、资源评价与排序以及资源的人际交互和理解的基本准则,它还承担向数字图书馆中高层协议中间件提供标准数据访问接口的功能。完整、全面的标准规范对于数字图书馆的建设是非常重要的。2007年度都柏林核心(DC)与元数据应用国际研讨会在新加坡举行,在元数据的标准规范方面提出被称为“新加坡框架”的元数据应用规范,其规定了一整套元数据方案需要包含五类文档,其中必备的“领域模型”和“元数据集描述”并要求以较为严格的机读形式编码(UML和XML/RDF),保证元数据应用的各项形式化约束具有一致性和延续性[2]
  系统的异构性是构建数字图书馆、实现信息资源全面整合的突出问题,异构资源互操作问题主要解决平台异构、操作系统异构、数据库异构问题,可采用CORBA、Z39.50等技术手段来解决异构系统的互连互通。目前,比较典型的解决方案是利用XML作为数据的传送格式,允许服务提供者和服务客户经过防火墙Internet上进行通信,基于HTTP、XML、RPC的SOAP实现平台与环境的无关性和独立性。提供开放式链接,以实现系统间的互操作:开放式链接基于正在出现的、OpenURL、CrossRef标准,能够无缝地链接所有数字图书馆资源,而不论这些资源使用什么样的软件系统[3]

《E-Science环境下科学数据的整合与共享.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

相关热搜

《E-Science环境下科学数据的整合与共享.doc》

VIP请直接点击按钮下载本文的Word文档下载到电脑,请使用最新版的WORD和WPS软件打开,如发现文档不全可以联系客服申请处理。

文档下载
VIP免费下载文档

浏览记录