自然语言处理
文章平均质量分 59
安立桐
学生一枚
展开
-
【Python】收集一些常见的错误,慢慢更新。
001.IndentationError: unexpected indent 001.缩进错误:意想不到的缩进python对于格式的要求是很严格的,缩进问题说大不大,说小不小。这种错误最容易出现在复制了一行代码之后,因为很可能你就多复制了一个空格。去掉空格之后,果然就对了呢。待续原创 2017-03-06 22:08:56 · 329 阅读 · 0 评论 -
【Python&NLP】Python入门、自然语言处理以及nltk的安装
初入python,直接学习自然语言处理,没有意外的话这就是我研究生的研究方向了,瞬间就变得顺眼了起来。一、python安装https://www.python.org/我个人下载的是python2.7.13x32位,比较稳定。下面是IDLE的显示情况。下面是python.exe的显示情况。然后我看这个有点寒酸,就想用一个ide,想来想去我决定用eclip原创 2017-03-05 22:26:30 · 1046 阅读 · 0 评论 -
【Python&NLP】nltk的几个基础函数
昨天安装了nltk,今天来学习一下几个常用的函数。text.concordance(word)这个函数就是用来搜索单词word在text 中出现多的情况,包括出现的那一行,重点强调上下文。text.similar(word)这个函数的作用则是根据word 的上下文的单词的情况,来查找具有相似的上下文的单词. 比如monstrous 在上面可以看到,有原创 2017-03-06 16:02:26 · 3166 阅读 · 0 评论 -
【Python&NLP】一些没什么用处的经验,结巴分词的安装心路历程
由于我主要需要做的是中文的自然语言处理,所以必须安装一个中文的分词包,师姐的推荐下,我选择了结巴分词。不过这个结巴分词……折磨了我一整天。也不知道我是怎么安装的,import jieba是没有问题的,但是写程序的时候就总是报错。UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 108: ordi原创 2017-03-08 10:57:30 · 422 阅读 · 0 评论 -
【Python&NLP】WordNet的应用
语言学交流平台来自上海的语言学交流平台什么是WordNet?WordNet是普林斯顿大学认知科学实验室与计算机系联合开发的一个英语词库,收录了超过十万个实词。在WordNet中,意义相近的单词组成一个同义词组(Synset),而同义词组之间则以上-下义,同义-反义,整体-部分以及蕴含等语义关系连接在一起,构成一个由同义词组作为转载 2017-03-31 10:52:00 · 6698 阅读 · 2 评论