Python利用selenium简单的爬取网易云歌曲排行榜

最新推荐文章于 2022-07-11 21:16:41 发布

水中的凛

最新推荐文章于 2022-07-11 21:16:41 发布

阅读量3.2k

点赞数 7

本文链接：https://blog.csdn.net/weixin_44930163/article/details/112854340

版权

最近学习了一下selenuim和XPath,技术还很菜,简单的爬取了一下网易云歌曲的排行榜信息,最后保存到mongodb里面

要爬取的部分如下图所示:
在这里插入图片描述
爬取每个歌曲的排名,名称,时长,歌手。

创建mongodb连接对象,指定数据库和集合

# 创建mongodb连接对象
client = pymongo.MongoClient(host='localhost',port = 27017)
# 指定数据库
db = client.test
# 指定集合
collection = db.songList

创建Chrome浏览器对象,调用get()方法访问页面。

# 导入包
from selenium import webdriver
# 创建浏览器对象
driver = webdriver.Chrome()
# 访问页面
driver.get('https://music.163.com/')

然后在网易云音乐首页点击排行榜进入要爬取的页面,利用selenium查找节点和点击的功能可以完成这些操作。

# 利用find_element_by_xpath()方法找到排行榜按钮的节点,click()完成点击操作。
driver.find_element_by_xpath('//*[@id="g_nav2"]/div/ul/li[2]/a/em').click()

到了排行榜页面需要注意的是,歌曲的信息在子Frame里面,光查找节点是找不到的,需要先切换到Frame里面,利用switch_to.frame()方

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

水中的凛

关注关注

7
点赞
踩
49

收藏

觉得还不错? 一键收藏
7
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【爬虫】使用selenium爬取网易云音乐热歌榜

weixin_49184448的博客

11-29

1975

使用selenium爬取网易云音乐热歌榜

【爬虫】使用selenium爬取网易云音乐热评

最新发布

weixin_49184448的博客

11-29

1055

使用selenium爬取网易云音乐热评

7 条评论您还未登录，请先登录后发表或查看评论

使用selenium爬取网易云音乐

hanjinjian的博客

05-17

1035

import requests from selenium import webdriver import re import json from queue import Queue import threading from selenium.webdriver.chrome.options import Options class Music: def __init__(se...

使用Selenium爬取网易云音乐的所有排行榜歌曲

qq_41644945的博客

11-28

3623

项目目标: 获取到一些简单的信息，排名，歌曲名称，时长，歌手，并且将歌曲下载下来抓取分析：在开始爬取之前需要确保已经安装好selenium，requests，lxml库，通过页面分析得到排行榜榜单都是一个ID对应的页面，获取到ID之后就可以进入相对应的榜单，进入榜单页面之后，网易云的页面是一个iframe子页面，使用selenium进去子页面后提取页面的代码，再使用Xpath对页面进行解...

使用selenium抓取网易云音乐数据

手把手教你学编程

04-14

1539

使用selenium爬取网易云音乐所有分类的歌单

weixin_43550933的博客

07-04

638

大部分注释都有 import requests from lxml import etree from selenium import webdriver class Music: def __init__(self): self.driver=webdriver.Chrome() #该url为网易云音乐所有分类首页 self.url="https://music.163.com/#/discover/playlist/" #该方法为

Selenium爬取网易云音乐评论

A1L__的博客

08-08

1335

Selenium爬取网易云音乐评论一、爬取工具 1.1 selenium selenium这是一个第三方库我们可以通过 pip install selenium来安装这个第三方库。 Selenium 是一个 Web 的自动化测试工具，最初是为网站自动化测试而开发的，就像玩游戏用的按键精灵，可以按指定的命令自动操作。Selenium 测试工具直接操控浏览器中，就像真正的用户在操作一样。Selenium 可以根据的指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏，或者判断网站上某些动作是否

python3爬取网易云歌曲,利用python3爬取网易云周杰伦所有专辑，歌曲，评论，并完成可视-站长资讯中心...

weixin_35056641的博客

03-25

1543

这篇文章适合于python纯小白，因为本人也是python刚刚入门，里面可能很多语句是冗长的，甚至可能有一些尚未发现的BUG，这个伴随着我们继续学习来慢慢消解吧。接下来我把里面会用到的东西在这里做一个简单总结吧：本文用到了两门解释性编程语言python3 + bash(shell),为什么用shell，我会在后面具体分析。用到的模块requests,re,os,jieba,glob,json,l...

python利用selenium爬取网易云入驻歌手id、歌手主页id、歌手姓名、歌手粉丝数量

PINK_PEACH_STAR的博客

06-14

1331

首先需要访问入驻歌手页，可以看到两个a结点中的链接，其中第一个链接为歌手主页，后面的数字是其主页id；第二个链接为歌手的信息主页，后面的数字为歌手id，通过第二个链接的访问可以查看歌手的粉丝数量成功查看粉丝数量注意事项： 1.网页源代码中使用了框架，所以需要使用selenium的switch_to_frame("g_iframe")功能查看框架源代码 2. 入驻歌手界面需要一直往下滑动滑动条，滑动到底部，才能获取所有的入驻歌手信息代码如下： from selenium i..

python利用selenium爬取网易云音乐

qq_22542787的博客

07-01

857

from selenium import webdriver import time class WY: def __init__(self): self.url = "https://music.163.com/#/discover/playlist/" self.driver = webdriver.Chrome() def all_url_1(self): ''' 定义各个大分类的名称和url ...

15行Python代码搞定网易云热门歌单

Python专栏

03-10

785

0. 引言今天是国际著名的214情人节，你过的是情人节还是正月初十呢？是否需要一首歌来抚慰你，受伤或躁动的心灵。来吧，今天教你用15行代码搞定热门歌单。学起来并听起来吧。本文使用的是Selenium模块，它是一个自动化测试工具，利用它我们可以驱动浏览器执行特定的动作，如点击、下拉等等操作，对于一些 JavaScript 渲染的页面来说，此种抓取方式非常有效。另外采用了Chrome浏览器配合Se...

使用selenium爬取网易云热门评论（超详细）

Harden13_的博客

07-08

2017

爬虫（七）通过Selenium爬取网易云音乐评论

weixin_41169182的博客

09-15

4088

爬虫实战(二) 用Python爬取网易云歌单

半虹小站

04-10

4158

最近，博主喜欢上了听歌，但是又苦于找不到好音乐，于是就打算到网易云的歌单中逛逛本着 “用技术改变生活” 的想法，于是便想着写一个爬虫爬取网易云的歌单，并按播放量自动进行排序

Python爬虫之实例---用selenium爬取网易云评论

caribbean666的博客

07-11

1525

Python爬虫之实例---用selenium爬取网易云评论

Selenium爬取36万条数据告诉你：网易云音乐热评究竟有什么规律？

qq_36807888的博客

12-01

1631

网易云音乐火不火我不知道，可是评论很火，之前也见过不少的帖子抓取网易云音乐评论，今天咱们也来试试这篇文章主要介绍了python selenium爬取网易云音乐热评，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧 Selenium安装在此之前我们首先要准备好selenium的配置和安装，如下： selenium可以直接可以用pip安装。 pipinstallselenium chromedr..

Python爬虫实战：网易云音乐爬取！

爬遍所有网站

11-12

6059

本次目标爬取网易云音乐 https://music.163.com/ PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入环境 python 3.6 pycharm 爬虫代码导入工具 import requestsimport re 请求网站、解析网站数据 def get_music_url(music_id, music_title): url = 'https://api.zhuol..

python爬取网易云飙升榜数据

m0_62004321的博客

12-05

4722

Python Selenium 爬取网易云音乐歌单名全解析与代码示例

本文将详细介绍如何使用Python的Selenium库来爬取网易云音乐（NetEase Music）的歌单名称。Selenium是一个强大的自动化测试工具，它允许我们模拟用户行为，包括在网页上执行JavaScript操作。在这个案例中，我们将...