自然语言处理
文章平均质量分 88
AI壹号堂
长期从事机器学习、深度学习相关领域的研究
展开
-
轻松理解TF-IDF原理及应用
在了解TF-IDF原理前,我们首先需要高清楚为啥需要它以及它能解决什么问题?下面我们先从以计数为特征的文本向量化来说起。以计数特征文本向量化的不足 计数特征,简单来讲就是统计每个特征词在文档中出现的次数,把次数作为特征的权重。因此在以计数特征文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如我们将下面4个短文本做了词频统计: corpus=[ ...原创 2018-08-09 09:39:53 · 2029 阅读 · 0 评论 -
中文分词学习路线图
中文分词作为自然语言处理技术(NLP)的底层技术之一,是自然语言处理入门的第一步。因此学习好中文分词技术对于学习好NLP后续技术有着至关重要的作用,因此本文总结了中文分词技术的学习路线图,希望能给中文分词学习者提供一点帮助。下面我们给出中文分词学习路线图同时特意录制了先关视频课程,喜欢的可以看下: 课程视频地址:http://study.163.com/course/intr...原创 2018-07-31 13:45:05 · 499 阅读 · 0 评论 -
轻松理解循环神经网路
最近看了台湾大学李宏毅老师讲的RNN视频,觉得非常好,因此总结一下,希望对自己有提升,同时也分享给需要的朋友。下面进入正题:我们先来看一个例子,在订票系统或者说更通用的智能客服中都涉及到Slot Filling问题,具体如下图:如上图所示,针对用户提出的I would like to arrive Taipei on November 2nd,ticket booking syst...原创 2018-12-19 17:07:26 · 256 阅读 · 0 评论 -
中文命名实体识别实战学习路线图-揭开中文命名实体识别的神秘面纱
中文命名实体识别实战学习路线图-揭开中文命名实体识别的神秘面纱命名实体识别作为自然语言处理 的基础技术之一,在自然语言处理上游各个任务(问答系统、机器翻译、对话系统等)重扮演者十分重要的角色,因此深入掌握命名实体识别技术,是作为自然语言处理从业者毕本技能,本学习路线图理论与实践相结合,希望能给大家带来帮助。本学习路线图主要从最简单的基于BiLSTM+CRF的中文命名实体模型到基于IDCNN+CR...原创 2019-10-06 10:47:46 · 664 阅读 · 0 评论