今天终终终于学习到了Python的爬虫,我爬取的是QQ音乐新歌榜单的歌手和歌曲(前9名),大致步骤是:
图片来自
图片来源
代码如下:
import requests
import bs4
res = requests.get("https://y.qq.com")
soup_song = bs4.BeautifulSoup(res.text, 'html.parser')
targets_song = soup_song.find_all('div', class_= 'songlist__cont')
soup_songer = bs4.BeautifulSoup(res.text, 'html.parser')
targets_songer = soup_songer.find_all('a', class_= 'c_tx_thin singer_name')
songer = []
song = []
for each in targets_songer:
songer.append(each.get_text())
for each in targets_song:
song.append(each.a.get_text())
for i in range(len(songer)):
print("%s - %s" % (songer[i], song[i]))
效果如下:
在这过程中,还注意到了Python3中的一个函数:zip,这个是列表里面的函数,zip函数详细内容请查阅该网站
后面学习到爬虫的新知识会再上传~~~