- 博客(10)
- 资源 (19)
- 收藏
- 关注
原创 wordnet
http://www.nltk.org/howto/wordnet.htmlWordNet InterfaceWordNet is just another NLTK corpus reader, and can be imported like this: WordNet的导入。from nltk.corpus import wordnetFor more compact code, we re
2016-01-18 17:00:46 3060
原创 单复数的转换
一个方案是pattern.en 自带的 singular一个方案是 inflect http://stackoverflow.com/questions/33972717/convert-plural-nouns-to-singular-nlp?rq=1
2016-01-18 12:10:53 4311
原创 命名实体的提取
一个是书上可能会有讲,论文里面应该也有涉及的时候,百度谷歌都可以上嘛。 nltk的库, nltk.chunk.conlltags2tree()是荷兰语的 nltk.ne_chunk()已经训练好了的,可以识别命名实体的分类器。
2016-01-18 09:48:29 1205
原创 抽空总结一下word2vec吧。
感觉做事情老不靠谱。 中文文档,这里有一个 word2vec的数学原理,百度文库。 讲得比较通俗吧。http://deeplearning4j.org/zh-word2vec.htmlhttps://www.zhihu.com/topic/19886836/top-answershttp://dataunion.org/10760.htmlhttp://itindex.net/detail/507
2016-01-13 20:22:52 619
原创 养成一些习惯
欢迎使用Markdown编辑器写博客我也不知道,感觉和各种人接触多了,对自己的积极影响还是蛮大的。一些要积极改变的东西。定时总结记录。一直都有懒惰的习惯啊。深入了解问题,而不是解决完一个问题就好,知其然,知其所以然,不然你以后还会遇到类似的坎。其实是和第一点是类似的。记得用谷歌兼容百度不要拒绝好用的工具。看官方文档有时候速度更快。像师姐那样迅速地尝试,而且也要敢去改别人的代码。不要畏难
2016-01-13 20:12:37 391
原创 treemap
http://mbostock.github.io/d3/talk/20111018/treemap.htmlhttp://bl.ocks.org/davetaz/9954190
2016-01-11 16:02:18 488
原创 英语断句
一种方式是利用nltk的断句功能 http://www.nltk.org/api/nltk.tokenize.html nltk.tokenize.punkt 模块断句的问题:简单的断句虽然可以利用一些标点符号断句,但是这里面有个问题是比如姓氏 Mr. Smith这样的句子,断句就会有问题。这个模块需要大的预料库进行训练 。 用法也很简单>>> import nltk.data>>> te
2016-01-07 22:09:40 2874
原创 numpy
import numpy as nplist 转 arraylist=[]a = np.array(list)array 转listb = a.tolist()
2016-01-05 22:23:00 583
转载 Markdown
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-01-05 22:20:50 327
sentiwords情感词
2015-11-24
图片批量下载
2015-01-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人