《老人与海》是我最喜爱的一部外国名著,该作围绕一位老年古巴渔夫,与一条巨大的马林鱼在离岸很远的湾流中搏斗而展开故事的讲述。尽管海明威笔下的老人是悲剧性的,但他身上却有着尼采"超人"的品质,泰然自若地接受失败,沉着勇敢地面对死亡,这些"硬汉子"体现了海明威的人生哲学和道德理想,即人类不向命运低头,永不服输的斗士精神和积极向上的乐观人生态度。
现在我们通过python来分析第一章中出现最多的单词,通过jieba库和word cloud库将里面出现的单词的频率图像化地表现出来。
一、新建一个记事本文件,并重命名为The old man and the sea
二、把《老人与海》第一章放到刚刚建立的txt文件里边
三、工具的准备,需要安装jieba库和wordcloud库
from os import path
from wordcloud import WordCloud
import matplotlib.pyplot as plt
d=path.dirname(__file__)
text=open(path.join(d,"The old man and the sea.txt")).read()
# 步骤3-2:设置一张词云图对象
wordcloud = WordCloud(background_color="white", max_font_size=40).generate(text)
# 步骤4-1:创建一个图表画布
plt.figure()
# 步骤4-2:设置图片
plt.imshow(wordcloud, interpolation="bilinear")
# 步骤4-3:取消图表x、y轴
plt.axis("off")
# 显示图片
plt.show()
这里我出现了一点点小差错,因为我的pip版本是18.1的,我需要更新到19.0,否则无法安装wordcloud库
到这里终于完成jieba库和wordcloud库的安装!!!!!!!
三、编写代码
四、运行结果如下
我们可以看到,出现最多的是boat和old man。