目录
第一章
先抛出一个问题,能解答的同志给我留言(主要是切换type的问题)
#统计top50频率的词汇
fdist1 = FreqDist(text1)
#print(fdist1)
vocabulary1 = list(FreqDist(text1).keys())
vocabulary1[:50]
改进版本:
#top50频次显示
for i in list(FreqDist(text1).keys())[:50]:
print(i,end =':' )
print(fdist1[i])
纵坐标非累计分数,查看了函数,无药可救。
bigrams(['more', 'is', 'said', 'than', 'done'])
无解
本书的第一章中还有一个babelize_shell()翻译函数,键入后会出现下面错误:
NameError: name ‘babelize_shell’ is not defined
原因是因为该模块已经不再可用了。
利用Python的条件分支和循环就可以简单的来处理一些文本信息。