madmangt-CSDN博客

原创 Python自然语言分析（第四期）：第3课书面作业

# -*- coding: UTF-8 -*- import nltk #使用语料库模块处理 austen-persuasion.txt。这本书中有多少词标识符？多少词类型？ emma = nltk.corpus.gutenberg.words('austen-emma.txt') len(emma) #求取文本中的词标识符 len(set(emma)) #求取文本中的词类型

2017-06-11 23:37:38 512

原创 Python自然语言分析（第四期）：第2课书面作业

# -*- coding: UTF-8 -*- import nltk from nltk.book import * len_text2 = len(text2) len_dis_text2 = len(set(text2)) print("在text2中有" + str(len_text2) + "个词") print("在text2中有" + str(len_dis_text2) +

2017-06-05 00:14:20 277

原创 Python自然语言分析（第四期）：第1课书面作业

第1课书面作业

2017-05-22 18:41:49 511

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人