【PaperReading】HiPub: translating PubMed and PMC texts to networks for knowledge discovery

HiPub是一个Chrome浏览器插件,能自动识别、注释和转换PubMed与PMC文献中的生物医学实体成网络,帮助科研人员高效提取知识。它结合了PubTator和BEST实体提取工具,识别基因、蛋白质、疾病等实体,通过构建网络展示实体关系,支持用户扩展和自定义,提供功能丰富度分析。
摘要由CSDN通过智能技术生成

这篇文章介绍了一个知识提取插件:HiPub,使用时下载其扩展程序放到你的Chrome中就可以使用了

HiPub:将PubMed和PMC文档转换成网络以提取知识

摘要

我们介绍了HiPub,一个无缝的Chrome浏览器插件,能够从文本中自动识别、注释以及转换生物实体为网络以提取知识。使用两个不同命名实体识别资源的别和,HiPub能够识别文本中的基因、蛋白质、疾病、药物、突变体以及细胞系,并且达到了很高的查准率和查全率。HiPub从文本中提取生物实体关系以构建特定文本网络,并且从额外的数据库中整合了已有的网络数据以提取知识。这使得用户能够从相关的文章中添加额外的实体,并且也能由用户自己来定义一些新的实体以发现新的、未经发现的实体关系。HiPub提供了在生物实体网络上的功能的丰富度分析,并且标出了与外部的资源以帮助用户学习到新的实体和关系。

介绍

许多特定生物文本的生物医学文献都是与基因、蛋白质、药物的相互作用关系相关的。通过从这些文献中挖学以及设计一个实验数据集可以形成一些新的假设,并且这些假设也能够在知识提取过程中被证实或驳倒。然而,现有的生物医学出版物出现的数目与速率越来越大而快,我们在知识提取以使用的能力还不够。例如PubMed和PMC目前有超过2千6百万篇摘要以及4百万篇全文,并且据统计,PubMed每天都会收到超过3000篇新的摘要。因此,对于研究者在其研究中去手动的提取这些相关信息中的内容是不太可能的。

为了解决这个挑战,我们开发了HiPub,一个Chrome浏览器插件,能够从文献中自动标出、注释以及转换生物医学实体(例如基因、蛋白质、药物、疾病等)为网络以进行知识提取。与相关的工具相比,HiPub具有以下一些独一无二的特点和优点:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值