NER
学无止境还得学
技术更新很快,只有自己不断学习,不断进步,才能与时俱进。
展开
-
2020-08-24
关键词摘取 关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来。这个可以追溯到文献检索初期,关键词是为了文献标引工作,从报告、论文中选取出来用以表示全文主题内容信息的单词或术语,在现在的报告和论文中,我们依然可以看到关键词这一项。因此,关键词在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用,它不仅是进行这些工作不可或缺的基础和前提,也是互联网上信息建库的一项重要工作 本文介绍的是在文本中获取关键词的俩种方法 1.TF-IDF 2.Text-Rank 下面介绍一些关于关键词抽取的常用和经原创 2020-08-24 17:33:35 · 401 阅读 · 0 评论 -
2020-08-20
NLP — 条件随机场CRF详解 CRF定义 这里定义只讲线性链随机场,针对自然语言处理领域的处理进行设计,因此这里只提线性链随机场定义: 线性链条件随机场)设X = (X_1,X_2,X_3,…,X_n),Y=(Y_1,Y_2,Y_3,…,Y_n)均为线性链表示的随机变量序列,若在给定随机变量序列的条件下,随机变量序列Y的条件概率分布就构成条件随机场,即满足马尔可夫性 P(Y_i|X,Y_1,Y_2,…,Y_{i-1},Y_{i+1},…,Y_n) = P(Y_i|X,Y_{i-1},Y_{i+1}) 则原创 2020-08-20 15:48:46 · 164 阅读 · 0 评论