自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

W&J

  • 博客(2)
  • 收藏
  • 关注

原创 python实现HMM做中文分词-----有监督模型

隐马尔科夫模型的简单介绍: 五个元组: 1、初始化π 2、状态转移矩阵 A N*N (N为所有可能的状态q数) 3、观测概率分布 B N*M(M为所有可能的观测值) 4、观测值序列 O {o1,o2……oT} 5、状态值序列 I {i1,i2……iT} 以中文分词为例 状态值的取值有四个{B,E,M,S} B: begin 起始词 E:end 结尾词 M: mi...

2018-04-17 18:37:29 2625 1

原创 Seq2Seq Tensorflow 实现之数据处理

一、数据处理 代码地址:https://github.com/Wang-Anna (稍后会上传代码) 1、实现中文、英文的分词 2、创建字典、以实现单词和索引之间的转换 1.英文分词: WORD_SPLIT= r'[,.!?/\':;\")(]' def en_tokenize(sentence): """split the sentence with WORD_SPLI...

2018-04-15 20:14:14 550

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除