python爬取某音乐歌词,将内容保存制作词云图

前言

嗨喽!大家好,这里是魔王。

音乐,无论什么时候都有无数人欣赏,好的歌曲还能共情!今天我们就来爬一爬音乐,使用歌词来制作一张有趣的词云图叭~
请添加图片描述

【介绍】

  1. python爬虫爬取某音乐歌词,将内容保存
  2. 并制作出词云图

【模块】

  1. requests 发送数据请求 (安装方法 >>>pip install requests)
  2. parsel 数据解析模块 (安装方法 >>>pip install parsel)
  3. jieba 中文分词 ( 安装方法 >>>pip install jieba)
  4. imageio 图片处理模块 ( 安装方法 >>>pip install imageio))
  5. wordcloud 词云图制作模块 (安装方法 >>>pip install wordcloud)

方法 : xpath爬取方法
请添加图片描述

【介绍内容】

需要的数据都是什么

  • 歌名
  • 歌词

在哪里,从哪里找

【代码实现步骤】

  1. 获取网页地址 (目标地址)
  2. 发送请求
  3. 数据解析
  4. 保存数据
  5. 制作词云图

【导入模块】

import requests
import parsel
import jieba
import imageio
import wordcloud

目标地址

url = ‘http://www.kuwo.cn/play_detail/199390992’

制作Python词云图需要使用到wordcloud库,下面是一个简单的制作词云图的步骤: 1. 安装wordcloud库 可以使用pip命令进行安装,例如:`pip install wordcloud` 2. 准备文本 准备你要制作词云图的文本,例如从文件中读取文本或是从网页中爬取文本。 3. 分词 使用Python中的jieba库对文本进行分词,将每个词语拆分开来。 4. 去除停用词 去除一些无意义的停用词,例如“的”、“是”、“我”等等。可以使用Python中的中文停用词库,例如stopwords。 5. 统计词频 统计每个词语在文本中出现的频率,可以使用Python中的collections库中的Counter函数。 6. 制作词云 使用wordcloud库制作词云图,根据词语出现的频率来设置词语的大小,并将词语放置在词云图中。 下面是一个简单的示例代码: ``` import jieba from collections import Counter from wordcloud import WordCloud # 读取文本 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词 words = jieba.cut(text) # 去除停用词 stopwords = set(['的', '是', '我', '你', '他', '她', '我们', '你们', '他们']) filtered_words = [word for word in words if word not in stopwords] # 统计词频 word_count = Counter(filtered_words) # 制作词云 wc = WordCloud(font_path='msyh.ttc', width=800, height=600) wc.generate_from_frequencies(word_count) # 保存词云图 wc.to_file('wordcloud.png') ``` 以上就是制作Python词云图的基本步骤,根据实际需求可以进行更加复杂的操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值