自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 从统计学看NLP之维特比Vertbi(2)

前言上一篇博客中简单介绍了下维特比算法,但是没有细纠其中的细节,本文将会以一个分词的例子来讲解维特比算法。分词分词已经是目前比较成熟的技术了,市面上也有很多优秀的包供大家使用,但是你真的明白了其中的原理吗。分词的方式有基于匹配规则的,也有基于语言模型,深度学习模型来的,但是其原理终究还是离不开上一篇博客介绍的那个流程即预分词+语言模型。本文将会给大家先简单介绍一下基于匹配规则的分词方式,最...

2019-09-17 16:04:11 398

原创 从统计学看NLP之概述(1)

前言在我看来NLP的所有思想都是基于统计学来的,不管是HMM,CRF还是说目前火热的神经网络,而目前入行NLP领域的同学可能大部分都没有接触过其中的统计学原理,所谓的神经网络没可解释性也导致大家没兴趣去研究为什么NLP的神经网络要这么去设计。在接下来的一系列文章中,我将会给大家从统计学的角度来揭开NLP原理的神秘面纱。机器翻译说到机器翻译,目前大部分都是采用seq2seq的模型,如果你是一...

2019-09-11 22:14:12 934

原创 NLP竞赛tricks

长期更新中,如果其中提到的技巧对您有帮助,请点个赞。本文是对于我之前参加过的NLP比赛总结出来的一些经验,希望这些tricks能对大家有所帮助。输入1、字向量2、词向量3、位置编码,tm的相对位置编码或者w2v思路的位置编码4、对于字向量与词向量如果要采用相加的形式组合在一起,可以把词向量重复n词,n表示的是当前词有多少个字序列标注问题1、采用BI0做数据标注2、预测开始位置与结...

2019-09-03 21:26:12 1383

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除