requests + BeautifulSoup爬图片（入门）

最新推荐文章于 2024-06-14 17:12:09 发布

꧁༺贪༒恋༻꧂

最新推荐文章于 2024-06-14 17:12:09 发布

阅读量309

点赞数

本文链接：https://blog.csdn.net/weixin_42533539/article/details/83721601

版权

1.获取网页源代码

2.找我们需要的信息

将获取的源代码转换为BeeautifulSoup对象

soup = BeautifulSoup(html.text,'html.parser') #用自带的html.parser解析，速度慢但通用

在搜索需要的数据

all_a = soup.find('div', class_='tab_box').find_all('a', target='_blank')

for a in all_a:
   print(a

通过函数find（）定位我们需要的节点，并打印。运行结果如下图：

再一次使用find（）函数获得图片链接

pic_url = a.find(name='img')

第一页的所有图片连接就全得到了

接下来就该获取多页

首先我们找到页码的位置

用函数find（）找到我们需要的页码

暂时还没捋顺就先获取前五页吧

for i in range(1,6):

    href = 'http://www.win4000.com/mt/dilireba_' + str(i) + '.html'
    print(href)

结果如下：

把这个放在我们需要的节点之前，如下图：

完了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注