开放科学背景下的科学数据开放共享:国家青藏高原科学数据中心的实践
潘小多1,2, 李新1,2, 冉有华3, 郭学军2
1 中国科学院青藏高原研究所国家青藏高原科学数据中心,北京 100101
2 中国科学院青藏高原研究所青藏高原地球系统与资源环境国家重点实验室,北京 100101
3 中国科学院西北生态环境资源研究院,甘肃 兰州 730000
摘要:介绍了开放科学和开放数据实践活动的概念、内涵和对科学研究的重要性;详细阐述了现阶段开放数据面临的挑战,如数据引用、数据计量、数据互操作和大数据分析等;并以国家青藏高原科学数据中心为例,阐述其在数据引用、数据互操作和大数据分析等开放数据方面的举措和数据共享成效;最后展望了数据中心对开放数据的促进作用。
关键词:开放数据 ; 数据引用 ; 数据计量 ; 数据互操作 ; 大数据分析 ; 地球科学
论文引用格式:
潘小多, 李新, 冉有华, 等. 开放科学背景下的科学数据开放共享:国家青藏高原科学数据中心的实践[J]. 大数据, 2022, 8(1): 113-120.
PAN X D, LI X, RAN Y H, et al. Open access of scientific data in the context of open science: the practice of the National Tibetan Plateau Data Center[J]. Big Data Research, 2022, 8(1): 113-120.
0 引言
开放科学指科学家通过互联网免费分享他们的研究数据、方法、代码、实验室笔记和其他研究过程,以便能够被重复使用和复现,实现协作研究的科学实践,其旨在消除科学研究过程中的访问障碍,使得研究者可共享任何类型的研究成果、资源、方法或工具,促进科学的自由传播,加强科学合作和信息共享,推动科学进程。开放科学运动最早可以追溯到17世纪的启蒙运动时期,但是“开放科学”这个术语直到1998年才被史蒂夫·曼提出,当时他注册了域名openscience.com和openscience.org,这标志着开放科学开始步入人们的视野。开放科学代表了一种全新的科学研究范式,它依赖于建立在数字化技术和新型协作工具上的协作型研究和新的知识传播方式。开放科学的理念反映了50年来科学研究的范式转变:以前的标准做法是将研究成果发表在科学出版物上,而现在的趋势是在研究过程的早期阶段就共享和使用所有可用的知识。
开放科学的实践得到越来越多人的认可和采用,比如开放获取的学术论文、共享数据和开放代码等。McKiernan E C等人通过回顾大量文献发现,开放获取学术论文有利于增加科研工作者的学术论文引用、媒体关注、潜在合作者、就业机会和资助机会等。虽然开放数据对于用户和促进科学发展等方面的益处不言而喻,但是科学数据没有像学术论文那样广泛采用开放获取的共享方式,一个重要的原因是研究人员不确定分享科学数据会对他们的职业生涯造成