- 博客(2)
- 收藏
- 关注
原创 隐马尔科夫模型(Hidden Markov Model)(一)
##前言 隐马尔科夫模型是一种重要的概率图模型,也是自然语言处理中一种最为快速最为有效的模型,成功的解决了语音识别,机器翻译问题,最近转自然语言处理,所以对一些相关模型进行总结,以便日后工作中可以灵活使用去解决各类自然语言问题。 ...
2019-04-10 15:43:50 399
原创 spark on yarn上使用nltk
在spark集群上使用nltk有一个小小的问题,ntlk不关是调用库就可以,还可能需要依整一些离线的文件并且需要放在指定的目录下面比如放在home/xxxx/目录下面,这样在调用库的时候它就可以在指定目录下面找到离线文件,但是在大的集群上面没有管理员帮忙维护的话,需要自己去添加一下这些目录到运行节点的目录下面,这个有点麻烦,总结一下个人解决办法: 1、将nltk_data目录通过addFile上传...
2019-04-04 18:29:11 509
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人