python——request_html库的使用

最新推荐文章于 2024-08-13 15:47:49 发布

puck441

最新推荐文章于 2024-08-13 15:47:49 发布

阅读量5.1k

点赞数 1

分类专栏： python request_html 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xljdawow111/article/details/81071382

版权

python 同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

这个库真的很好用，以往学过的爬虫技术，urllib、urllib2、bs4、scrapy、正则都不如它来的方便，优点之一就是不用构造hreaders，如果GITHUB说的是真的，那么这个库连反爬虫都不需要考虑了，很方便也很实用。

https://github.com/kennethreitz/requests-html GitHub源地址

from requests_html import HTMLSession
import urllib.request
import time

session=HTMLSession()

urls = ['http://www.win4000.com/zt/mao_{}.html'.format(str(i)) for i in range(1, 5)]
# url='http://www.win4000.com/zt/mao_1.html'
for url in urls:
    r=session.get(url)
    time.sleep(1)
    hrefs=r.html.find('div.tab_box>div>ul.clearfix>li>a>img')
    hrefs2 = r.html.find('div.tab_box>div>ul.clearfix>li>a')
    for href2 in hrefs2[:-5]:
        # print(href2.find('img'))
        name=href2.text
        print(name)
        for i in href2.find('img'):
            print(i.attrs['data-original'])  #这就是图片下载地址，str类型
            urllib.request.urlretrieve(i.attrs['data-original'], 'F:\AV\pachong\%s.jpg' %name)

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

puck441 CSDN认证博客专家 CSDN认证企业博客

码龄12年

6: 原创

55万+: 周排名

13万+: 总排名

1万+: 访问

: 等级

192: 积分

8: 粉丝

3: 获赞

4: 评论

11: 收藏

私信

关注

热门文章

分类专栏

python 6篇
request_html 1篇
爬虫 1篇

最新评论

HTMLTestRunner.py
CSDN-Ada助手: 恭喜您在博客中分享了关于HTMLTestRunner.py的内容！持续创作是非常了不起的，我很期待能够看到您更多关于HTMLTestRunner.py的深入探讨。或许您可以考虑分享一些关于如何在实际项目中应用HTMLTestRunner.py的经验和技巧，这对于读者来说会非常有帮助。期待您的更多精彩内容！
python补充超级鹰代码
韦唯。: 能问一下为什么return后面要加括号吗
python、selenium、webdriver——自动登录豆瓣功能（解决验证码登录）
puck441: 最下面的if判断，用来判断豆瓣首页有没有验证码，没有验证码就只输入账号密码登录，然后存储cookie后，下次使用cookie登录；如果有验证码图片元素存在，那么就调用超级鹰api，输入账号、密码、验证码后登录，存储cookie和使用cookie登录。
python补充超级鹰代码
puck441: 源py文件不是这样写的，我这边手动添加了一个result222函数，用来返回图片jpg转验证码str的内容，这样调用该py文件之后，就能直接拿到验证码了。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。