- 博客(3)
- 收藏
- 关注
原创 序列标注
自然语言处理中的序列标注问题在目前, 比较主流的技术是语言模型(如LSTM, BERT)+CRF(条件随机场)。想要了解CRF(条件随机场), 首先了解一下隐马尔可夫模型(Hidden Markov Model), 是一种概率图模型(CRF也是), 只要理解了HMM模型和维特比解码算法(viterbi algorothm), 理解条件随机场就成了分分钟的事.1.NER(命名实体识别)问题概述;命名实体识别(英语:Named Entity Recognition,简称NER), 是指识别文本中具有特定
2020-09-19 21:56:30 334
转载 中文自然语言处理的完整流程
第一步:获取语料语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以,人们简单地用文本作为替代,并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语料库(Corpus),当有几个这样的文本集合的时候,我们称之为语料库集合(Corpora)。(定义来源:百度百科)按语料来源,我们将语料分为以下两种:1.已有语料很多业务部门、公司等组织随着业务发展都会积累有大量的纸质或者电子文本资料。那么,对于这些资料,在允许的条件下我们稍加整合,把纸质的文本
2020-09-19 20:10:43 3964
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人