- 博客(3)
- 收藏
- 关注
原创 从统计学看NLP之维特比Vertbi(2)
前言上一篇博客中简单介绍了下维特比算法,但是没有细纠其中的细节,本文将会以一个分词的例子来讲解维特比算法。分词分词已经是目前比较成熟的技术了,市面上也有很多优秀的包供大家使用,但是你真的明白了其中的原理吗。分词的方式有基于匹配规则的,也有基于语言模型,深度学习模型来的,但是其原理终究还是离不开上一篇博客介绍的那个流程即预分词+语言模型。本文将会给大家先简单介绍一下基于匹配规则的分词方式,最...
2019-09-17 16:04:11 398
原创 从统计学看NLP之概述(1)
前言在我看来NLP的所有思想都是基于统计学来的,不管是HMM,CRF还是说目前火热的神经网络,而目前入行NLP领域的同学可能大部分都没有接触过其中的统计学原理,所谓的神经网络没可解释性也导致大家没兴趣去研究为什么NLP的神经网络要这么去设计。在接下来的一系列文章中,我将会给大家从统计学的角度来揭开NLP原理的神秘面纱。机器翻译说到机器翻译,目前大部分都是采用seq2seq的模型,如果你是一...
2019-09-11 22:14:12 934
原创 NLP竞赛tricks
长期更新中,如果其中提到的技巧对您有帮助,请点个赞。本文是对于我之前参加过的NLP比赛总结出来的一些经验,希望这些tricks能对大家有所帮助。输入1、字向量2、词向量3、位置编码,tm的相对位置编码或者w2v思路的位置编码4、对于字向量与词向量如果要采用相加的形式组合在一起,可以把词向量重复n词,n表示的是当前词有多少个字序列标注问题1、采用BI0做数据标注2、预测开始位置与结...
2019-09-03 21:26:12 1383
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人