网易云
本次爬取在2020/08/11进行成果
引进模块
from selenium import webdriver
调取模块内容
browser=webdriver.Chrome()
进入链接
browser.get('http://music.163.com/#/discover/toplist')
进入页面中页面
iframe=browser.find_element_by_id('g_iframe')
browser.switch_to.frame(iframe)
找到要查找的大块
parent=browser.find_element_by_tag_name('tbody')
找到里面所有的小块
trs=browser.find_elements_by_tag_name('tr')
len(trs)
循环 并找到最终内容
data=[]
for each_tr in trs[1:]:
rank=each_tr.find_element_by_class_name('num').text
songName=each_tr.find_element_by_tag_name('b&#