正则

最新推荐文章于 2024-05-20 10:35:51 发布

抓个霸哥

最新推荐文章于 2024-05-20 10:35:51 发布

阅读量140

点赞数

本文链接：https://blog.csdn.net/hupi_jiandan/article/details/107676677

版权

        for x in div_a:
            url = re.compile('href="(.*?)"',re.S)
            print(url.findall(x)[0])

xpath 就按照标签一步一步往下 // 就是全局查找 class 和id 都是一样弄
# next_page_url = response.xpath('//div[@class="ui pagination menu"]/a[last()]' ).extract()
# next_page_url = response.xpath('//div[@class="ui pagination menu"]/a[1]' ).extract()#a的【】只能正着写比如 12345 不能写成-1 -2-3-4，最后一个可以写成last（）