![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP自然语言处理
文章平均质量分 88
主要创作或转载NLP最核心和最火热的技术原理和实战。
蒹葭杰克
三天打鱼两条晒网,那么永远是菜鸡!
展开
-
Sequence Models
序列模型 如下图,常见的几个序列模型的应用:1、语音识别 2、音乐生产 3、文本情感分类 4、DNA序列分析 5、机器翻译 6、视频运动识别 7、命名实体识别。 下图是该博客使用的符号说明: x代表输入序列,y代表输出序列 ,用右上角尖括号x<t>x^{<t>}x<t>代表x的第t个位置的数据,TxT_xTx代表输入x的序列长度,相应的TyT_yTy...原创 2019-10-14 22:30:27 · 1662 阅读 · 0 评论 -
统计语言模型、HMM与中文分词
序言 深感自然语言处理领域知识量非常大,任重而道远,自己才疏学浅,写篇博文,以便温故而知新。 中文分词是中文自然语言处理的一个基础工作,它的好坏直接决定后续结果的好坏,目前分词算法已经比较成熟,市面上也有很多好用的分词工具可以直接使用,比如大家最熟悉的结巴分词(jieba)。但它并不是完美的,同时它的内部原理你知道吗? 中文分词的起步阶段-- 基于词典的匹配 首先你要有一个中文词典,世面上有...原创 2019-09-21 18:43:19 · 719 阅读 · 0 评论 -
通过实例轻松理解条件随机场(CRF)?
理解条件随机场最好的办法就是用一个现实的例子来说明它。但是目前中文的条件随机场文章鲜有这样干的,可能写文章的人都是大牛,不屑于举例子吧。于是乎,我翻译了这篇文章。希望对其他伙伴有所帮助。 原文在这里http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields 想直接看英文的朋友可以直接点进去了。我在翻译时并...转载 2019-09-25 11:29:31 · 304 阅读 · 1 评论 -
中文分词之HMM
关于HMM模型的介绍,网上的资料已经烂大街,但是大部分都是在背书背公式,本文在此针对HMM模型在中文分词中的应用,讲讲实现原理。 尽可能的撇开公式,撇开推导。结合实际开源代码作为例子,争取做到雅俗共赏,童叟无欺。 没有公式,就没有伤害。 模型介绍 第一次听说HMM模型是从李开复的博文论文中听说的: 李开复1988年的博士论文发表了第一个基于隐马尔科夫模型(HMM)的语音识别系统Sphi...转载 2019-09-25 15:11:07 · 168 阅读 · 0 评论