- 博客(2)
- 收藏
- 关注
原创 python实现HMM做中文分词-----有监督模型
隐马尔科夫模型的简单介绍: 五个元组: 1、初始化π 2、状态转移矩阵 A N*N (N为所有可能的状态q数) 3、观测概率分布 B N*M(M为所有可能的观测值) 4、观测值序列 O {o1,o2……oT} 5、状态值序列 I {i1,i2……iT} 以中文分词为例 状态值的取值有四个{B,E,M,S} B: begin 起始词 E:end 结尾词 M: mi...
2018-04-17 18:37:29 2625 1
原创 Seq2Seq Tensorflow 实现之数据处理
一、数据处理 代码地址:https://github.com/Wang-Anna (稍后会上传代码) 1、实现中文、英文的分词 2、创建字典、以实现单词和索引之间的转换 1.英文分词: WORD_SPLIT= r'[,.!?/\':;\")(]' def en_tokenize(sentence): """split the sentence with WORD_SPLI...
2018-04-15 20:14:14 550
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人