Python自然语言处理
小青年阿坚
手捧着微弱火苗,风雨中越过溪流和丛林。
展开
-
python+nltk+numpy环境搭建
这两天一直在尝试nltk下的各种函数,今天在绘制频率分布图和分布表的时候又遇到了问题。(对python的环境搭建简直充满怨念报错:ModuleNotFoundError: No module named 'matplotlib'然后就是安装numpy下载地址:https://pypi.python.org/pypi/numpy/可以提前配置环境变量,或者直接 cd +pip原创 2017-03-27 15:31:11 · 1463 阅读 · 0 评论 -
windows上安装Anaconda和python
转载自:http://www.cnblogs.com/denny402/p/5121501.html一提到数字图像处理编程,可能大多数人就会想到matlab,但matlab也有自身的缺点:1、不开源,价格贵2、软件容量大。一般3G以上,高版本甚至达5G以上。3、只能做研究,不易转化成软件。因此,我们这里使用Python这个脚本语言来进行数字图像处理。要使用pytho转载 2017-03-27 16:49:45 · 1065 阅读 · 0 评论 -
NLTK之搜索文本的相关入门函数(二)
·计数函数1.len() 计算文本长度(以单词和标点符号为单位)>>>len(text1)44764>>>2.set() 用于获取文本词汇表(去重)3.sorted() 得到一个词汇条目的排序表,这个表以各种标点开始,然后接着是以A开头的词汇,大写排在小写之前。>>>sorted(set(text3))['!',"'",'(',')',',','.','A'原创 2017-03-20 21:10:57 · 823 阅读 · 0 评论 -
NLTK之搜索文本的相关入门函数(一)
·搜索文本用到的相关函数1.concordance() 函数;利用函数concordance可以显示指定单词在文本中出现情况,并显示上下文。如下例中,查找单词monstrous>>>from nltk.book import*....>>>text1.concordance("monstrous")Building index...Displaying 11 of 11matche原创 2017-03-19 19:58:42 · 1325 阅读 · 1 评论 -
NLTK安装tips
1.可直接去官网nltk:https://pypi.python.org/pypi/nltk 下载安装包 直接进行安装配置2.nltk 3.2.2要求版本是Python 2.7或者3.4+在直接使用官网的安装包进行安装进行安装时可能会报错,比如 我就遇到了Python -32 was required,which was not found in registry。可能原因:1.原创 2017-03-24 09:49:57 · 548 阅读 · 1 评论 -
nltk之使用正则表达式检测词组搭配
注:本文中用箭头表示正则表达式 如:《patt》在Python中使用正则表达式,需要使用 import re 导入 re函数库·使用基本的元字符使用正则表达式《ed$》查找以ed结尾的词汇。使用函数 re.search(p,s) 检查字符串s做是否有模式p。import rewordlist=[w for w in nltk.corpus.words.words('en')原创 2017-04-10 11:07:52 · 2548 阅读 · 0 评论