准备
豆瓣读书网址是:https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4?start=880&type=T
红色箭头标记的就是我们要获取的信息,我们有了目标信息,就能找到页面的源码,我们通过解析源码来获取信息数据,我们如何获取源码呢?这时可引入request来解决,实现代码如下:
import requests
resp = requests.get('https://book.douban.com/top250?start=0')
print(resp.text)
运行程序我们能就能得到HTML信息,问题来了,获取了HTML信息,怎样获取我们想要的目标信息呢?
打开浏览器,按键盘F12,从页面源码找到我们想要的目标信息,如图所示: