Python爬取招聘网站招聘信息

仅供个人学习笔记使用。

from lxml import etree

parser = etree.HTMLParser(encoding='utf-8')
html = etree.parse('招聘网站.html',parser=parser)
#1、获取所有li标签
# //li
# xpath函数返回的是一个列表
trs = html.xpath('//li')
for li in trs:
    print(etree.tostring(li,encoding='utf-8').decode('utf-8'))

# 2、获取第2个li标签
li = html.xpath('//li[1]')[0]
print(etree.tostring(li,encoding='utf-8').decode('utf-8'))

# #3、获取所有class等于con_list_item的li标签
trs = html.xpath("//li[@class='con_list_item first_row default_list']")
for li in trs:
    print(etree.tostring(li,encoding='utf-8').decode('utf-8'))

# #4、获取所有a标签的href属性
aList = html.xpath('//a[@href]')
for a in aList:
    print(etree.tostring(a, encoding='utf-8').decode('utf-8'))

# #5、获取所有的职位信息(纯文本)
trs = html.xpath('//li[position()>0]')
positions =[]
for li in trs:
    # 在某个标签下,再执行xpath函数,获取这个标签下的子孙元素,那么应该在//之前加一个点,代表当前元素下获取
    url = li.xpath('.//a/@href')[0]

    position = li.xpath(".//h3/text()")[0]
    salary = li.xpath(".//span[@class='money']/text()")[0]
    job_exper = li.xpath(".//div[@class='li_b_l']/text()")[2]
    zhaopin_date = li.xpath(".//span[@class='format-time']/text()")[0]
    company = li.xpath(".//div/a[@data-lg-tj-id='8F00']/text()")[0]
    company_size = li.xpath(".//div[@class='industry']/text()")[0]
    introduce = li.xpath(".//div[@class='li_b_r']/text()")[0]

    position = {
        '网址':url.strip(),
        '公司地址':position.strip(),
        '薪资':salary.strip(),
        '工作经验':job_exper.strip(),
        '招聘日期':zhaopin_date.strip(),
        '公司名称':company.strip(),
        '公司规模':company_size.strip(),
        '公司介绍':introduce.strip()
    }
    positions.append(position)
print(positions)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

D2cOneluo

万一有大佬给个打赏呢,对不对。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值