55种数据可视化开源工具
在数字或开源工具的采用方面落后于其他行业的一个行业是科学出版领域竞争激烈且利润丰厚的世界。 根据史蒂芬·布兰妮(Stephen Buranyi)去年在《卫报》上发表的数据,每年价值超过19B英镑(26B美元),选择,出版和共享当今最重要的科学研究的系统仍然承受着印刷媒体的许多限制。 新的数字时代技术为加速发现,使科学变得协作而不是竞争以及将投资从基础设施开发转向对社会有益的研究提供了巨大的机会。
非营利性eLife倡议是由研究的资助者建立的,部分目的是鼓励为此目的使用这些技术。 除了出版有关生命科学和生物医学研究的重要进展的开放获取期刊外,eLife还使自己成为一个实验平台和展示研究通讯创新的平台,其中大部分实验都基于开源精神。
从事开放出版基础设施项目的工作为我们提供了机会,以加快我们认为对学术出版行业的发展至关重要的技术和用户体验(UX)最佳实践类型的普及和采用。 一般来讲,开源产品的用户体验通常不开发,这在某些情况下可能会阻止人们使用它。 作为对OSS开发的投资的一部分,我们非常重视UX,以鼓励用户采用这些产品。
我们所有的代码都是开源的,我们积极鼓励社区参与我们的项目,这对我们来说意味着更快的迭代,更多的实验,更高的透明度以及更多的工作机会。
我们参与的项目,例如Libero(以前称为eLife Continuum )和Reproducible Document Stack的开发 ,以及我们最近与Hypothesis的合作,都显示了如何使用OSS进行评估的积极变化,出版和传播新发现。
Libero
Libero是可供发行商使用的一套服务和应用程序,包括后期制作发行系统,完整的前端用户界面模式套件,Libero的Lens Reader,开放的API以及搜索和推荐引擎。
去年,我们采用了用户驱动的方法来重新设计Libero的前端,从而减少了站点“家具”的注意力,并更加关注研究文章。 我们与eLife社区的成员一起测试并迭代了网站的所有关键功能区域,以确保为所有人提供最佳的阅读体验。 该网站的新API还提供了对内容的更简单访问,以提高机器可读性,包括文本挖掘,机器学习和在线应用程序开发。
我们网站上的内容和推动新设计的模式都是开源的,以鼓励eLife和其他希望使用它的发布者未来的产品开发。
可复制文档堆栈
eLife与Substance和Stencila合作,还参与了一个创建可复制文档堆栈(RDS)的项目,RDS是用于在线创作,编译和发布可计算可复制手稿的开放式工具堆栈。
如今,越来越多的研究人员能够通过诸如R Markdown和Python之类的语言来记录其计算实验。 这些可以作为实验记录的重要组成部分,尽管它们可以独立于结果研究文章或与研究文章一起共享,但传统的发布工作流程往往会将这些资产作为次要内容来使用。 要发表论文,使用这些语言的研究人员通常别无选择,只能以数字形式将其计算结果作为“扁平化”输出提交,从而损失了计算中使用的代码和数据引用的大量价值和可重用性。 尽管Jupyter之类的电子笔记本解决方案可以使研究人员以易于重用和可执行的形式发布其代码,但这仍然是已出版手稿的补充,而不是其组成部分。
可复制文档堆栈项目旨在通过开发和发布可复制手稿的工作原型来解决这些挑战,该手稿将代码和数据视为文档的组成部分,展示了从创作到发布的完整的端到端技术堆栈。 最终,它将允许作者以包括嵌入式代码块和计算出的输出(统计结果,表格或图形)在内的格式提交稿件,并使这些资产在整个发布过程中保持可见和可执行。 然后,发布者将能够直接将这些资产保留为已发布的在线文章的组成部分。
假设打开注释
最近,我们与Hypothesis合作推出了开放注释,使我们网站的用户可以发表评论,突出文章的重要部分并与在线阅读互动。
通过这次合作,开源的Hypothesis软件通过新的审核功能,单点登录身份验证和用户界面自定义选项进行了自定义,从而使发布者可以更好地控制其在网站上的实施。 这些增强功能已经推动了围绕已发表学术内容的高质量讨论。
该工具可以无缝集成到发布者的网站中,学术发布平台PubFactory和内容解决方案提供商Ingenta已经充分利用了其改进的功能集。 HighWire和Silverchair还为发布者提供了实施该服务的机会。
其他行业和开源
随着时间的推移,我们希望看到更多的出版商采用“假设”,“ Libero”和其他项目,以帮助他们促进重要科学研究的发现和重用。 但是,由于这些技术以及其他OSS技术在其他行业中也很普遍,因此eLife能够利用机遇。
没有高质量,得到良好支持的开源软件及其周围的社区,数据科学世界将无处不在。 TensorFlow就是一个很好的例子。 得益于OSS及其社区,与其他计算领域相比,人工智能和机器学习的所有领域都得到了快速的加速和发展。 与之类似的是,Linux作为云网络主机的使用量爆炸性增长,随后是使用Docker的容器化,现在Kubernetes的增长(Kubernetes是GitHub上最受欢迎的开源项目之一)。
所有这些技术使组织可以事半功倍,专注于创新,而不必重新发明轮子。 最后,这就是OSS的真正好处:它使我们所有人都可以在彼此的成功的基础上互相学习彼此的失败。
我们一直在寻找机会,在研究和技术的界面上与最优秀的新兴人才和思想接触。 在eLife Labs上找到有关这些活动的更多信息,或联系innovation@elifesciences.org获取更多信息。
翻译自: https://opensource.com/article/18/3/scientific-publishing-software
55种数据可视化开源工具