入门必备!生物医学命名实体识别(BioNER)最全论文清单,附SOTA结果汇总

640?

作者丨罗凌

学校丨大连理工大学博士

研究方向丨深度学习、文本分类


本人将之前整理的一些 生物医学命名实体识别相关的论文做了一个 BioNER Progress 放在了 Github 上。主要内容包括 BioNER 进展中的代表论文列表,以及 目前各个主要数据集上的一些先进结果和相关论文,希望对入门 BioNER 的同学有所帮助。

Github地址:
https://github.com/lingluodlut/BioNER-Progress

640?wx_fmt=png


生物医学命名实体识别(Biomedical Named Entity Recognition, BioNER)相关进展,BioNER Progress 主要内容包括两部分:1)BioNER 进展中的代表论文列表(Papers);2)目前各个主要数据集上的一些先进结果和相关论文(SOTA)。 

其中,论文列表首先给出一些综述论文,然后根据 BioNER 研究的发展历程依次给出了基于词典,基于规则和基于机器学习方法的代表性工作。机器学习的方法又细分为了基于传统机器学习模型(SVM、HMM、MEMM 和 CRF 模型)以及现在主流的神经网络方法。

此外,SOTA 给出了目前各个主要数据集上的一些先进结果。根据实体类型的不同包括化学药物(Chemical)、疾病(Disease)、基因蛋白(Gene/Protein)、基因变异(Mutation)和物种(Species)的实体识别。


必读论文



640?wx_fmt=png

▶▷ 综述论文

Overview of BioCreative II gene mention recognition. Smith L, Tanabe L K, nee Ando R J, et al. Genome biology, 2008, 9(2): S2. 

https://genomebiology.biomedcentral.com/articles/10.1186/gb-2008-9-s2-s2

Biomedical named entity recognition: a survey of machine-learning tools. Campos D, Matos S, Oliveira J L. Theory and Applications for Advanced Text Mining, 2012: 175-195. 

https://books.google.com.hk/books?hl=zh-CN&lr=&id=EfqdDwAAQBAJ&oi=fnd&pg=PA175&ots=WEKIblRekC&sig=FWoufJtWVSDHD3gbWaZXruEOiEs&redir_esc=y#v=onepage&q&f=false

Chemical named entities recognition: a review on approaches and applications. Eltyeb S, Salim N. Journal of cheminformatics, 2014, 6(1): 17. 

https://jcheminf.biomedcentral.com/articles/10.1186/1758-2946-6-17

CHEMDNER: The drugs and chemical names extraction challenge. Krallinger M, Leitner F, Rabal O, et al. Journal of cheminformatics, 2015, 7(1): S1. 

https://jcheminf.biomedcentral.com/articles/10.1186/1758-2946-7-S1-S1

A comparative study for biomedical named entity recognition. Wang X, Yang C, Guan R. International Journal of Machine Learning and Cybernetics, 2015, 9(3): 373-382. 

https://link.springer.com/article/10.1007/s13042-015-0426-6

▷▶ 基于词典的方法

Using BLAST for identifying gene and protein names in journal articles. Krauthammer M, Rzhetsky A, Morozov P, et al. Gene, 2000, 259(1-2): 245-252. 

https://www.sciencedirect.com/science/article/pii/S0378111900004315

Boosting precision and recall of dictionary-based protein name recognition. Tsuruoka Y, Tsujii J. Proceedings of the ACL 2003 workshop on Natural language processing in biomedicine-Volume 13, 2003: 41-48. 

https://aclanthology.info/pdf/W/W03/W03-1306.pdf

Exploiting the performance of dictionary-based bio-entity name recognition in biomedical literature. Yang Z, Lin H, Li Y. Computational Biology and Chemistry, 2008, 32(4): 287-291.

https://www.sciencedirect.com/science/article/pii/S1476927108000340

A dictionary to identify small molecules and drugs in free text. Hettne K M, Stierum R H, Schuemie M J, et al. Bioinformatics, 2009, 25(22): 2983-2991. 

https://academic.oup.com/bioinformatics/article-abstract/25/22/2983/180399
https://biosemantics.org/index.php/resources/jochem

LINNAEUS: a species name identification system for biomedical literature. Gerner M, Nenadic G, Bergman C M. BMC bioinformatics, 2010, 11(1): 85. 

https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-11-85

▷▶ 基于规则的方法

Toward information extraction: identifying protein names from biological papers. Fukuda K, Tsunoda T, Tamura A, et al. Pac symp biocomput. 1998, 707(18): 707-718. 

https://pdfs.semanticscholar.org/335e/8b19ea50d3af6fcefe6f8421e2c9c8936f3f.pdf

A biological named entity recognizer. Narayanaswamy M, Ravikumar K E, Vijay-Shanker K. Biocomputing 2003. 2002: 4

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值