取决于数学符号_科学发现的未来取决于开放

取决于数学符号

Ross Mounce巴斯大学的博士后研究员,研究化石在系统发育和系统信息学中的用途,并于去年在巴斯大学获得博士学位。 罗斯是首批潘通研究员之一,也是开放知识基金会 (特别是开放科学工作组 )的积极成员。 他是开放科学的拥护者,并且他积极从事内容挖掘学术出版物的工作,以在荟萃分析中重用科学研究,从而获得有关进化模式的更高层​​次的见解。

在我与他的采访中了解更多内容,以了解“开源周”的职业生涯。

您能否简要介绍一下您的研究?

我目前的研究领域是系统信息学,我是巴斯大学Wills小组的博士后。 我从学术文献中获取已发表的进化树和其他进化数据,并在成千上万篇论文中进行此信息的荟萃分析和综合,以更深入地了解不同物种组的进化模式。 仅仅将这些数据从已发表的文献中重新转换为可重用,可计算的形式,是迄今为止我们项目面临的最艰巨的挑战。 作为BBSRC资助的PLUTo项目 (信息影像文献解锁工具)的一部分,我正在与Peter Murray-Rust和ContentMine团队合作开发软件工具和方法,以帮助自动化从文献中查找和提取系统发育数据的过程。


在“开源周”中查看“职业”中的完整文章集

这部分是大海捞针问题的根源。 在过去的十年中,有超过100,000篇包含系统发生的论文发表了,分布在1,000多种期刊中,每年发表的论文超过200万篇!

在巴斯大学,我们甚至没有合法访问我们知道系统发育数据所在的所有期刊的权利。 一旦找到,通常必须根据出版物中提供的图形图像重新解释数据。 在2010年,只有约4%的包含系统发育分析的已发表研究提供了其结果的机器可读,可重复使用的数据。 这种“数据匮乏”的情况在许多科学领域中并不罕见,并且可以通过传统期刊出版系统来实现—大多数期刊根本没有强大的数据共享要求。

Phylogeny Figures

为什么开放科学,开放源代码和开放数据对您很重要?

开放科学对于加快发现速度和继续为学术研究提供资金至关重要。 至少80%的学术研究是由公共或慈善机构资助的 。 因此,很明显,研究应该以最大的投资回报率进行。 鼓励共享,重用和协作以获取整体收益。 在“封闭式”科学中,更少的人可以阅读出版物(收费的),并且原始作者小组之外的任何人都不能重复使用数据或用于生成结果的代码。 封闭的科学模型导致效率低下,缓慢,困难。 研究人员可能仅仅是因为他们无权访问它们而忽略了他们的同行论文。 同样,研究人员浪费大量时间和资源来重新生成相同的数据或软件功能,因为其他研究人员没有/不会共享原始数据/代码。

在开放科学模式下,出版物向所有人开放,供所有人阅读和发现,同样,数据和代码也开放给其他所有人立即使用。 对我来说很明显,如果科学在开放模式下更频繁地运转,它将进步更快。

就个人而言,开放式科学对我而言至关重要。 我大部分的博士学位研究时间都是从学术PDF中抓取数据,或者通过电子邮件将其发布的数据的副本发送给作者(反馈相对较少)。 实在令人沮丧。 我没有做“科学”,而是做了乏味的,重复的但高度手动的简单任务。 如果作者按照长期存在的数据格式将数据与论文一起发表,我本可以将时间花在重新分析和扩展我们的知识范围上。 我与同事交谈,发现他们也有这些问题。 效率低下在我们社区中某种程度上是“正常的”。 因此,我在2011年与朋友们写了一封公开信,以强调这种浪费,并鼓励智能数据归档,《 自然新闻》Nature News)撰写了一篇有关它的故事,该故事有助于将其传播到古生物学界。 从那时起,像http://morphobank.org/这样的数据库的贡献率就更高了,但总的问题仍然存在:相对于书面出版物,数据在很大程度上仍然是一等公民。

您是第一批Panton研究员之一。 这是什么意思,这如何改变您的职业?

Panton奖学金开放知识基金会竞争性授予研究生和早期职业研究人员,其目的是使研究人员能够在其研究领域促进开放数据。 成功的项目包含有关科学中开放数据的潘顿原则 ,简而言之,该原则承认:

科学是建立在对已发表的科学知识的基础之上,对其进行再利用和公开批评的。 为了使科学有效地发挥作用,并使社会从科学工作中获得全部收益, 公开科学数据至关重要。

我的团契让我有强烈的目标感,对我对学科中数据的获取方式的幻想破灭了,可以做一些积极的事情。 这曾经是,现在仍然是我简历的真正亮点。 该奖项的认可以及财务和道义上的支持使我有信心在许多不同的会议上发表有关科学领域与开放数据有关的问题的演讲,使这些问题引起了听众的听众,否则他们将不愿听取任何与科学有关的信息。狭窄的,与学科相关的学术研究。 奖学金使我对决策和政策影响力的重要性敞开了大门,这在传统学术界通常是被忽略的。 确实,我所听到的最受欢迎的演讲是在布鲁塞尔举行的欧盟委员会“欧洲许可”文本和数据挖掘工作组会议上,向欧盟提供了有关欧洲研究人员面临的挑战和困难的证据在这种类型的研究中。 如果没有潘顿研究金,我将永远不会参加过本次会议,或许多类似会议,对研究政策产生积极影响。

奖学金也改变了我的学术研究方向。 我们三人与我的奖学金获得者之一(Peter Murray-Rust)和我的博士生导师(Matthew Wills)一起,写了一个非常开放的科学资助计划,以解放和使埋藏在文献中的数据可重复使用再次,这是成功的,这就是我现在在第一个博士后PLUTo项目中正在研究的内容。

开放对您作为一名科学家意味着什么?其他科学家又该如何开放?

开放性进行正式定义,无论是在科学领域内还是外部,例如The Open Definition

“如果任何人都可以自由使用,重用和重新分发数据或内容,则这些数据或内容是开放的-最多仅取决于对属性和/或共享的要求。”

在科学的背景下,这意味着学术出版物只有在获得OKD兼容开放许可证(例如, 知识共享署名许可知识共享零放弃)的 许可后才能进行开放访问 。 同样,如果数据是根据符合OKD的许可证明确许可的,则数据仅是开放数据 ,否则显然不受版权保护。

如此精确地定义开放似乎很乏味,但这确实很重要。 我正在为PLUTo项目挖掘的图形图像显然受版权保护,即使它们包含不可复制的数据也是如此。 我可以在此处将开放许可的进化树图重新发布在Flickr上,这使我的研究过程更易于访问(减少枯燥!)和可搜索性。 我可以获取社区辅助的内容标记并查看指标以展示影响。

但是未按公开许可发布的研究数据无法/无法获得这种待遇,而且我的硬盘驱动器上目前存在大量此类问题。 我根本不允许共享它们,即使将整个收藏集公开发布在网络上对社区而言更有用。 发布者施加的限制意味着我只能重新发布可能找到的相关数据的10%。

科学家们本身可以从获得开放奖学金中获得一切收益,可以朝着这个方向采取一些非常简单的步骤 ,即:发布预印本,并使用机构或主题存储库获取所有研究成果(具体包括代码和数据,而不是只是出版物)。 有证据表明, 开放获取出版物 提供开放数据的 出版物都具有明显的引用优势,因此,进行开放奖学金确实符合个人的利益。

您是否看到将来与开源社区进行更大互动的空间?

绝对。 在我的科学领域(生态学,古生物学,系统发育学)中,开源显然正在“取胜”。 像R这样的开源软件和像Python这样的编程语言非常受欢迎。 像GitHub这样的在线平台几乎单枪匹马地改变了学术文化,通过git的使用,使许多科学家首次使用适当的分布式版本控制系统。 我什至帮助在GitHub上写了一篇学术论文 ! 对于开放科学及其与开放源社区的交汇来说,这是一个非常激动人心的时刻。

在“开源周”中查看来自“职业”的完整文章集。

翻译自: https://opensource.com/education/14/8/evolution-open

取决于数学符号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值