- 博客(3)
- 收藏
- 关注
原创 Python自然语言分析(第四期):第3课书面作业
# -*- coding: UTF-8 -*- import nltk #使用语料库模块处理 austen-persuasion.txt。这本书中有多少词标识符?多少词类型? emma = nltk.corpus.gutenberg.words('austen-emma.txt') len(emma) #求取文本中的词标识符 len(set(emma)) #求取文本中的词类型
2017-06-11 23:37:38 512
原创 Python自然语言分析(第四期):第2课书面作业
# -*- coding: UTF-8 -*- import nltk from nltk.book import * len_text2 = len(text2) len_dis_text2 = len(set(text2)) print("在text2中有" + str(len_text2) + "个词") print("在text2中有" + str(len_dis_text2) +
2017-06-05 00:14:20 277
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人