《PYTHON自然语言处理》代码笔记——第2章 获得文本语料和词汇资源
import nltk
from nltk.corpus import *
##古腾堡语料库---gutenberg
# print(nltk.corpus.gutenberg.fileids())
# emma = nltk.corpus.gutenberg.words('austen-emma.txt')
# print(len(emma))
#
# emma = nltk.Text(nltk...
转载
2018-08-21 10:42:57 ·
364 阅读 ·
0 评论