用Python从智联招聘自动爬取招聘信息

#coding:utf8
import re
import requests
import urllib
from lxml import etree
city = urllib.quote("北京")  #把utf8编码的\x改为适合网址的%
kw = "python"
url = """http://sou.zhaopin.com/jobs/searchresult.ashx?\
jl=%s&kw=%s&sm=0&sg=27ce606676a743128f9fbb1fa5dd09e7&p=1"""%(city,kw)
ret = requests.get(url)
reg = '<td class="Jobname">.*?href="(.*?)".*?</span>.*?</td>'
urlAll = re.findall(reg,ret.content,re.S)

for url1 in urlAll:
        ret1 = requests.get(url1)
        cont1 = ret1.content
        title = re.findall('<td colspan="2">.*?<h1>(.*?)</h1>.*?</td>',cont1,re.S)

        cmName = re.findall('<td colspan="2">.*?<h2>.*?<a target="_blank" href=".*?>(.*?)</a></h2>.*?</td>',cont1,re.S)

        money = re.findall('<tr>.*?职位月薪:</td>.*?<td valign="top">(.*?)</td>.*?</tr>',cont1,re.S)

        position = re.findall('td class=.*?>工作地点:</td>.*?<td.*?<a.*?>(.*?)</a>',cont1,re.S)

        print title[0],"+",cmName[0],"+月薪:",money[0],"+工作地点:",position[0]
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值