python爬站长素材中的免费简历

最新推荐文章于 2024-10-07 01:36:35 发布

TravelLight92

最新推荐文章于 2024-10-07 01:36:35 发布

阅读量247

点赞数 3

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/travellight92/article/details/140139544

版权

仅做学习用，不对相关网站抱有任何恶意或不良影响。

网站：站长素材-分享综合设计素材免费下载的平台

目标是爬取一些简历，在这里选中简历

随便挑一个类别：

import requests
from lxml import etree
import os

header = {
 把你自己的搞进去啊
}

if not os.path.exists('d:/jianli'):
    os.mkdir('d:/jianli')
# 进行翻页下载
for page in range(0, 4):
    if page == 0: 
        url = 'https://sc.chinaz.com/tag_jianli/GongChengShi.html' # 首页不带数字下标
    else:
        url = 'https://sc.chinaz.com/tag_jianli/GongChengShi_' + str(page) + '.html'
    response = requests.get(url, headers=header).text
    # response.encode('utf-8')
    tree = etree.HTML(response)
    resume_list = tree.xpath('//div[@id="main"]/div/div/a/@href')  # 这个很重要，要定位准确
    #  对一个简历详情进行查找下载
    for deatil in resume_list:
        every_url = 'https://sc.chinaz.com' + deatil

        info = requests.get(every_url, headers=header).content  # 乱码解决方案1
        little_tree = etree.HTML(info)
        try:  # 存在付费情况，无相关链接会报错
            resume_name = little_tree.xpath('//div[@class="ppt_tit clearfix"]/h1/text()')[0]  # 列表取出字符
            download_url = little_tree.xpath('//div[@class="down_wrap"]/div[2]/ul/li[1]/a/@href')[0]
            resume_get = requests.get(download_url, headers=header).content

            with open("d:/jianli/" + resume_name + '.rar', 'wb') as f:
                f.write(resume_get)
            print(resume_name + '下载成功')
        except:
            continue

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

TravelLight92 CSDN认证博客专家 CSDN认证企业博客

码龄3年

20: 原创

118万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

625: 积分

250: 粉丝

365: 获赞

7: 评论

454: 收藏

私信

关注

热门文章

最新评论

python爬站长素材中的免费简历
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AB test原理、公式、案例
ha_lydms: 我很喜欢作者的写作风格，简洁而有力，能够直击问题的核心。
AB test原理、公式、案例
CSDN-Ada助手: 恭喜您发布了关于AB测试原理、公式、案例的博客！这个话题非常有趣和实用，相信对很多人都会有所帮助。接下来，我建议您可以深入探讨一些AB测试的实际应用场景，或者分享一些优化AB测试结果的方法，这样可以让读者更加全面地了解这个领域。期待您更多精彩的创作！继续加油！
手写一个简单的线性回归、岭回归
普通网友: 支持一下！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
python生成随机姓名、工号、电话，自动排班
CSDN-Ada助手: 恭喜您发布了这么有趣的博客！看到您分享如何用Python生成随机姓名、工号、电话，并自动排班，真是让人眼前一亮。希望您能继续保持创作的热情，不断分享更多有趣的技术内容。或许下一步可以考虑深入探讨如何优化排班算法，或者分享一些实用的数据可视化技巧，让读者受益匪浅。期待您的下一篇博客，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。