2020网易云音乐python爬取操作语句

2 篇文章 0 订阅
1 篇文章 0 订阅
本文演示了如何利用Python的Selenium库爬取网易云音乐网页数据。首先打开Chrome浏览器,然后访问网易云音乐发现页。通过查找元素方法如find_element_by_id、find_element_by_class_name等定位到搜索框、输入关键字并点击搜索。接着滚动页面,切换窗口和iframe,并抓取歌曲列表中的歌曲编号、歌名和歌手信息,最后将数据保存到Excel文件。
摘要由CSDN通过智能技术生成

from selenium import webdriver
from openpyxl import WorkbookIn

打开浏览器

browser=webdriver.Chrome()In

访问网址

browser.get(‘http://www.baidu.com’)In

寻找标签2#找单个

xxx.find_element_by_id()
xxx.find_element_by_class_name()优先找到第一
xxx.find_element_by_tag_name()优先找到第一个6
找多个#xxx.find_elements_by_class_name()
xxx.find_elements_by_tag_name()
找到输入框

myinput=browser.find_element_by_id(‘kw’)

输入文字

myinput.send_keys(‘网易云音乐’)

找到按钮2btn=browser.find_element_by_id(‘su’)
xxx 点击 xxx.click()

btn.click()

找到browser.find_element_by_id(‘1’).find_element_by_tag_name(‘a’).click()
页面滚动browser.execute_script(‘window.scrollBy(左右距离,上下距离)’,’’)

browser.execute_script(‘window.scrollBy(0,660)’,’’)

获取所有窗口对象

handles=browser.window_handlesIn

最新打开的在最后一个

handles

切换窗口对象

browser.switch_to.window(handles[-1])
browser.get(‘https://music.163.com/#/discover/toplist’)

如何切换iframe
browser.switch_to.frame(iframe的id)
browser.switch_to.frame(iframe的name)
browser.switch_to.frame(通过普通寻找找到这个对象)
browser.switch_to.default_content()切换主文档iframe=browser.switch_to.frame(‘g_iframe’)

browser.switch_to.frame(iframe)
browser.switch_to.default_content()
logo=browser.find_element_by_class_name(‘logo’).find_element_by_tag_name(‘a’)
logo.text
logo.get_attribute(‘hidefocus’)
browser.switch_to.frame(‘g_iframe’)
son=browser.find_element_by_id(‘song-list-pre-cache’)bod=son.find_element_by_tag_name(‘tbody’)
trs=bod.find_elements_by_tag_name(‘tr’)
data1=[]
for i in trs:
data2=[]4
arr1=i.find_element_by_class_name(‘num’)
data2.append(arr1.text) arr2=i.find_element_by_class_name(‘txt’).find_element_by_tag_name(‘b’)
arr2.text
a=arr2.get_attribute(‘title’)
data2.append(a) arr3=i.find_element_by_class_name(‘text’).find_element_by_tag_name(‘span’)
arr3.text
b=arr3.get_attribute(‘title’)
data2.append(b)
print(data2)
wb=Workbook()
sheet=wb.active
for i in data2
sheet.append(i)
wb.save(‘zhuweilon.xlsx’)
browser.close()
browser.quit()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值