一、生成歌词词云
首先我们需要先获取所有爬取到的歌曲的歌词,将他们合成字符串
随后提取其中的中文,再合成字符串
text = re.findall('[\u4e00-\u9fa5]+', lyric, re.S) # 提取中文
text = " ".join(text)
之后使用jieba进行分词,并将其中分出来的长度大于等于2的词保存
word = jieba.cut(text, cut_all=True) # 分词
new_word = []
for i in word:
if len(i) >= 2:
new_word.append(i) # 只添加长度大于2的词
final_text = " ".join(new_word)
接下来为生成的词云选择一张好看的图片,就可以开始生成了!
mask = np.array(Image.open("2.jpg"))
word_cloud = WordCloud(background_color="white", width=800, height=600, max_words=100, max_font_size=80, contour_width=1, contour_color='lightblue', font_path="C:/Windows/Fonts/simfang.ttf", mask=mask).generate(final_text)
# plt.imshow(word_cloud, interpolation="bilinear")
# plt.axis(&