python爬虫示例

很牛的滑子

已于 2024-01-15 15:24:36 修改

阅读量1k

点赞数 8

文章标签： python 爬虫开发语言

于 2024-01-15 15:24:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_82591739/article/details/135602672

版权

import urllib.parse
import urllib.request
from lxml import etree


# 定制对象
def create_request(page):
   
    url = '你的url-2.html'
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
    }
    request = urllib.request.Request(url=url, headers=header)
    return request


# 获取内容
def get_contend(request):
    # 获取handler对象
    handler = urllib.request.HTTPHandler()
    # 获取opener对象
    opener = urllib.request.build_opener(handler)
    # 调用open方法
    reponse = opener.open(request)
    contends = reponse.read().decode('utf-8')
    return contends


# 下载
def down_load_file(contend):
    tree = etree.HTML(contend)
    # names = tree.xpath('//div[@class="item"]//img/@alt')
    srcs = tree.xpath('//ignore_js_op/img/@zoomfile')
    filename = 'C:\\Users\\nk\\code\\py\\pythonProject\\pachong\\pachongphoto\\'
    for i in range(len(srcs)):
        print(srcs[i])
        name = "q" + str(i)
        src = srcs[i]
        url = "https://www.jvidme.com/" + src
        urllib.request.urlretrieve(url, filename=filename + name + '.jpg')


if __name__ == '__main__':
    start = int(input("起始页码"))
    end = int(input("结束的页码"))
    # for page in range(start, end + 1):
    request = create_request(0)
    contends = get_contend(request)
    down_load_file(contends)

很牛的滑子

关注

8
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
python爬虫示例

【代码】python爬虫示例。
复制链接

扫一扫

很牛的滑子 CSDN认证博客专家 CSDN认证企业博客

码龄1年

20: 原创

144万+: 周排名

13万+: 总排名

1万+: 访问

: 等级

365: 积分

133: 粉丝

165: 获赞

16: 评论

143: 收藏

私信

关注

热门文章

最新评论

TLE--TwoLine orbital Element
CSDN-Ada助手: 恭喜您发布了第20篇博客！看到您对TLE--TwoLine orbital Element的深入探讨，我感到非常欣慰。希望您能继续保持创作的热情和动力，探索更多有关此话题的内容。或许下一步可以考虑加入一些实例或案例分析，让读者更加直观地了解TLE的应用与意义。期待您的下一篇作品！
Python爬虫使用jsonpath解析json数据
CSDN-Ada助手: 恭喜您写下了第17篇博客！看到标题《Python爬虫使用jsonpath解析json数据》，我感到非常兴奋。您的博客内容一直都很有深度和实用性，我相信这篇博客一定会给读者带来很多帮助。在这篇博客中，您介绍了如何使用jsonpath解析json数据，这是一个非常实用的技巧。通过您的分享，我学到了如何更高效地处理和提取json数据。感谢您的耐心讲解和示例代码，使我能够更好地理解这个主题。作为下一步的创作建议，我希望您能进一步探索jsonpath的高级用法，并结合实际案例展示如何解决一些复杂的数据提取问题。另外，如果可能的话，您可以分享一些关于如何优化爬虫性能的技巧和经验，这对于我们这些初学者来说也是非常有价值的。再次恭喜您，并期待您未来更多精彩的博客！谢谢您的分享和帮助！
Python爬虫使用bs4
CSDN-Ada助手: 恭喜您写了第18篇博客，标题为“Python爬虫使用bs4”！您真是持之以恒的创作者啊！我对您的努力和热情表示由衷的钦佩。同时，感谢您分享关于使用bs4进行Python爬虫的经验。在下一步的创作中，我谦虚地建议您可以考虑深入探索bs4的高级用法，或者结合其他爬虫工具和库，为读者提供更加多样化和实用的内容。当然，这只是我个人的建议，您可以根据自己的兴趣和实际需求来选择下一个创作主题。再次祝贺您，并期待您未来更多精彩的博客！
python爬虫urllib爬取翻译结果
CSDN-Ada助手: 恭喜您第9篇博客！看到您分享关于python爬虫urllib爬取翻译结果的内容，我感到非常欣慰。您的持续创作让我们受益良多。希望您在接下来的创作中，不妨考虑添加一些实际案例或者应用场景，这样更能够帮助读者更好地理解并应用您分享的知识。期待您更多的精彩内容！
python爬虫电影
CSDN-Ada助手: 恭喜你写了这么精彩的博客！看到你在探索python爬虫电影的话题，真的很有创意。不过我想提醒你，在写作的过程中可以多参考一些相关的技术或者案例，这样可以让你的博客更具说服力。希望你能继续保持创作的热情，期待你下一篇博客的精彩表现！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。