排序:
默认
按更新时间
按访问量

python调用stanfordNLP的NER接口

操作环境:python2.7ubuntu16.04 64位----------------------------------------------------------------步骤一:下载http://nlp.stanford.edu/software/stanford-ner-2014...

2018-03-21 19:08:46

阅读数:113

评论数:0

在线nltk分词和词性标注

text-processing.com/demo/tokenize/https://demos.explosion.ai/displacy/

2018-02-12 17:02:14

阅读数:65

评论数:0

使用nltk.pos出现IndexError: string index out of range

问题重现:# -*- encoding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') import nltk from nltk.corpus import stopwords text="I'v...

2018-02-12 15:02:01

阅读数:45

评论数:0

nltk英文词性标注

需要用nltk.download()下载punkt和averaged_preceptron_taggerimport nltk words = nltk.word_tokenize('And now for something completely different') print(words)...

2018-02-09 11:31:14

阅读数:166

评论数:0

中文高频词汇统计并绘制词云

转载自:https://www.jianshu.com/p/2052d21a704c代码如下:# -*- encoding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') import jieba.analyse f...

2018-02-08 10:12:14

阅读数:107

评论数:0

pytagcloud支持中文(汉仪全唐诗体简)

/home/appleyuchi/.virtualenvs/python2.7/lib/python2.7/site-packages/pytagcloud/fonts 增加HYQuanTangShiJ.ttf文件 然后修改fonts.json文件如下:[ { "name&...

2018-02-07 12:27:15

阅读数:64

评论数:0

随机森林针对中文文本分类

改编自博客: http://blog.csdn.net/github_36326955/article/details/54891204 做个笔记 代码按照1 2 3 4的顺序进行即可: 1.py(corpus_segment.py) [p...

2018-01-14 16:24:27

阅读数:804

评论数:0

决策树(CART算法)针对中文文本分类

改编自博客: http://blog.csdn.net/github_36326955/article/details/54891204 根据下面的参考了链接可知,sklearn中的决策树用的是CART算法 http://sofasofa.io/forum_main_post.p...

2018-01-14 16:16:19

阅读数:349

评论数:0

NLTK的图形化语料文本下载器downloader

进入python交互模式 输入 import nltk nltk.download()

2018-01-13 16:44:29

阅读数:45

评论数:0

NLPIR RuntimeError: NLPIR function 'NLPIR_Init' failed 解决方案

红帽子内核的(redhat,centos,scientific linux等),Data路径在   /usr/lib64/python2.7/site-packages/pynlpir/Data https://github.com/NLPIR-team/NLPIR/tree/...

2017-12-27 22:12:04

阅读数:40

评论数:0

中文词性标注

#-*- encoding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') import pynlpir import time pynlpir.open() start=time.time() s = '聊天机器...

2017-12-26 23:45:55

阅读数:83

评论数:0

把函数作为参数

P164-165 # -*- coding:utf-8 -*- import nltk sent=['Take','care','of','the','sense',',','and','the','sounds','will','take','care','of','themselves',...

2017-11-28 21:19:14

阅读数:37

评论数:0

使用pos标记寻找三词短语

# -*- coding:utf-8 -*- import nltk from nltk.corpus import brown def process(sentence): for(w1,t1),(w2,t2),(w3,t3) in nltk.trigrams(sentence): if(...

2017-11-28 21:00:10

阅读数:128

评论数:0

NLTK找出最频繁的名词标记的程序(代码详细解释)

代码来自《Python自然语言处理》,我做了详细的代码解释。 # -*- coding:utf-8 -*- import nltk def findtags(tag_prefix,tagged_text): a=tagged_text#这几行代码是为了输出tagged_text ...

2017-11-28 20:30:40

阅读数:122

评论数:0

NLTK频率分类种定义的函数

NLTK频率分类中定义的函数 例子 描述 fdist=FreqDist(samples) 创建包含给定样本的频率分布 fdist.inc(sample) 增加样本 fdist['monstrous'] 计数给定样本出现的次数 fdist.freq('monstrous') 样...

2017-11-28 20:22:12

阅读数:50

评论数:0

AttributeError: module 'networkx' has no attribute 'draw_graphviz'解决方案

环境: Python2.7 (64)、ubuntu环境下 被运行的代码来自《Python自然语言处理》的P185-186,代码如下: P185-186.py import networkx as nx import matplotlib from nltk.corpus import word...

2017-11-25 21:17:01

阅读数:961

评论数:1

nltk断句

import nltk import pprint sent_tokenizer=nltk.data.load('tokenizers/punkt/english.pickle') text=nltk.corpus.gutenberg.raw('chesterton-thursday.txt') ...

2017-11-25 14:47:25

阅读数:354

评论数:0

词形归并

Python 2.7.5 (default, Aug 4 2017, 00:39:18) [GCC 4.8.5 20150623 (Red Hat 4.8.5-16)] on linux2 Type "help", "copyright", "...

2017-11-25 11:19:36

阅读数:93

评论数:0

词干提取器索引文本

IndexedText.py文件: import nltk class IndexedText(object): def __init__(self,stemmer,text): self._text=text self._stemmer=stemmer ...

2017-11-22 22:00:30

阅读数:116

评论数:0

NLTK自带的词干提取器

代码来自《Python自然语言处理》P116 (python2.7) appleyuchi@ubuntu:~/.virtualenvs/python2.7/bin$ python Python 2.7.12 (default, Nov 19 2016, 06:48:10) [GCC 5.4.0...

2017-11-22 21:07:34

阅读数:443

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭