打开第一个链接,查看详细信息
关键点在于
前一个.jpg是原图,可以通过操作字符串的方式改写得到原链接
更早时候发布的图片,链接方式不一样
这里写一个判断获取的src是否为空就可以区分
关键问题解决,整理下思路
1.https://www.gracg.com/p599367964217379?page=1
改变“page=x”可以得到所有的图片的目录列表------format可以操作
2.xpath得到每个缩略图所指向的图片单独链接
def get_infos(url):
res=requests.get(url,headers=headers)
selector=etree.HTML(res.text)
pic_urls=selector.xpath('//div[@class="imgbox"]/a/@href