- 博客(3)
- 收藏
- 关注
原创 Python自然语言分析(第四期):第3课书面作业
# -*- coding: UTF-8 -*-import nltk#使用语料库模块处理 austen-persuasion.txt。这本书中有多少词标识符?多少词类型?emma = nltk.corpus.gutenberg.words('austen-emma.txt')len(emma) #求取文本中的词标识符len(set(emma)) #求取文本中的词类型
2017-06-11 23:37:38 500
原创 Python自然语言分析(第四期):第2课书面作业
# -*- coding: UTF-8 -*-import nltkfrom nltk.book import *len_text2 = len(text2)len_dis_text2 = len(set(text2))print("在text2中有" + str(len_text2) + "个词")print("在text2中有" + str(len_dis_text2) +
2017-06-05 00:14:20 271
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人