作业：爬取站长素材中的免费简历模板

寄给画家

已于 2023-12-12 09:59:53 修改

阅读量235

点赞数

文章标签：网络爬虫 python

于 2023-07-20 14:22:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_61333709/article/details/131829635

版权

import requests
from lxml import etree

url = 'https://aspx.sc.chinaz.com/query.aspx?keyword=%E5%85%8D%E8%B4%B9&issale=0&classID=864'
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.82'
}
# 对互联网页面获取
response = requests.get(url=url, headers=header).text
tree = etree.HTML(response)
# 第一次路径追踪。目标是局部爬虫获取该简历的url和名称
div_list = tree.xpath('//div[@class="box col3 ws_block"]')
for li in div_list:
    a_name = li.xpath('./a/img/@alt')[0] + '.rar'  # name同时也是下载路径
    don_url = li.xpath('./p/a/@href')  # url
    # 特判处理一下
    if don_url[0][0] != 'h':
        don_url[0] = 'https:' + don_url[0]
        # 第二次对单独简历页面获取
    response2 = requests.get(url=don_url[0], headers=header).text
    tree2 = etree.HTML(response2)
    # 第二次路径追踪，获取下载地址链接
    div_list2 = tree2.xpath('//div[@class="down_wrap"]/div[2]/ul/li[1]')
    for li2 in div_list2:
        # 得到下载链接
        don_path = li2.xpath('./a/@href')[0]
        # 对下下载链接响应
        response3 = requests.get(url=don_path, headers=header).content
        path = 'libs/' + a_name
        with open(path, 'wb') as fp:
            fp.write(response3)
            print(a_name + '下载完成')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
作业：爬取站长素材中的免费简历模板

【代码】作业：爬取站长素材中的免费简历模板。
复制链接

扫一扫

寄给画家 CSDN认证博客专家 CSDN认证企业博客

码龄3年

6: 原创

118万+: 周排名

193万+: 总排名

3341: 访问

: 等级

78: 积分

9: 粉丝

8: 获赞

5: 评论

1: 收藏

私信

关注

热门文章

分类专栏

笔记

最新评论

作业：爬取站长素材中的免费简历模板
2301_78036227: 恭喜您写了第6篇博客！标题“作业：爬取站长素材中的免费简历模板”非常吸引人。很高兴看到您在持续创作，这对于提升自己的技能和知识非常重要。希望您继续保持这样的势头！在下一步的创作中，我谦虚地建议您可以尝试分享一些关于如何优化简历模板的经验和技巧。例如，如何根据不同行业和职位需求来选择合适的简历模板，如何通过自己的设计能力将模板个性化，以及如何撰写简洁而有吸引力的自我介绍等等。这些内容将有助于读者更好地利用免费简历模板，提升他们的求职竞争力。再次恭喜您，并期待您未来更多精彩的创作！
简易网页采集器
CSDN-Ada助手: 恭喜您完成了第一篇博客！标题“简易网页采集器”听起来非常有趣和实用。通过您的博客，我了解到您对网页采集有一定的了解，并且能够将其简化成一个易于使用的工具。这是一个很好的开始！作为下一步的创作建议，我建议您可以进一步探索网页采集器的功能和用途。您可以介绍一些实际的应用案例，或者分享一些高级的技巧和技术，以帮助读者更好地利用网页采集器。此外，您还可以考虑添加一些实例代码或演示视频，以帮助读者更好地理解和应用您的教程。继续努力创作，我期待着您未来更多有趣而实用的博客！谦虚地说，我相信您的博客将会为许多人带来帮助和灵感。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
基础案例-破解百度翻译
CSDN-Ada助手: 非常棒的博客！你对破解百度翻译这个案例进行了很好的解析。继续保持创作，你一定会取得更大的进步！除了你在标题和摘要中提到的知识和技能，你还可以探索一下以下扩展知识和技能： 1. 数据分析：可以尝试对从抓包工具获取的响应数据进行分析，提取出有用的信息，并进行进一步的处理和可视化。 2. 网络安全：通过学习抓包工具的使用，你能够更深入地了解网络通信的原理和流程，从而增加对网络安全的认识。 3. 接口测试：对于这种通过post请求获取json类型响应数据的案例，你可以进一步学习如何进行接口测试，以确保系统的正常运行和安全性。 4. 编程技能：学习一门编程语言（比如Python），将抓包工具和数据分析技术结合起来，可以更加高效地进行数据处理和分析。希望以上建议对你有所帮助。期待看到你在这些领域的进一步发展和分享！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
爬取豆*电影喜剧类排行榜电影详情
CSDN-Ada助手: 恭喜你在博客上发表了第三篇文章！标题“爬取豆*电影喜剧类排行榜电影详情”听起来非常有趣。我很高兴看到你对电影排行榜的爬取和电影详情的分享感兴趣。我想给你一个创作建议，希望你能继续保持这种热情。在下一篇博客中，你可以考虑分享一些关于喜剧电影中的幽默元素或者是你个人对喜剧电影的观点。这样可以让读者更好地了解你对喜剧电影的理解和喜好。我希望我的建议对你有所帮助，并且期待着你未来更多精彩的文章！请继续保持努力和谦虚的态度。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
作业：爬取站长素材中的免费简历模板
CSDN-Ada助手: 恭喜您写了第6篇博客！标题“作业：爬取站长素材中的免费简历模板”非常吸引人。很高兴看到您在持续创作，这对于提升自己的技能和知识非常重要。希望您继续保持这样的势头！在下一步的创作中，我谦虚地建议您可以尝试分享一些关于如何优化简历模板的经验和技巧。例如，如何根据不同行业和职位需求来选择合适的简历模板，如何通过自己的设计能力将模板个性化，以及如何撰写简洁而有吸引力的自我介绍等等。这些内容将有助于读者更好地利用免费简历模板，提升他们的求职竞争力。再次恭喜您，并期待您未来更多精彩的创作！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

寄给画家 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。