用Python从智联招聘自动爬取招聘信息

最新推荐文章于 2024-06-05 11:43:07 发布

J了个X

最新推荐文章于 2024-06-05 11:43:07 发布

阅读量2.8k

点赞数 1

分类专栏：学习文章标签： python 招聘工作北京 jobs

本文链接：https://blog.csdn.net/gu_jin_xiao/article/details/25383649

版权

学习专栏收录该内容

47 篇文章 0 订阅

订阅专栏

#coding:utf8
import re
import requests
import urllib
from lxml import etree
city = urllib.quote("北京") #把utf8编码的\x改为适合网址的%
kw = "python"
url = """http://sou.zhaopin.com/jobs/searchresult.ashx?\
jl=%s&kw=%s&sm=0&sg=27ce606676a743128f9fbb1fa5dd09e7&p=1"""%(city,kw)
ret = requests.get(url)
reg = '<td class="Jobname">.*?href="(.*?)".*?</span>.*?</td>'
urlAll = re.findall(reg,ret.content,re.S)

for url1 in urlAll:
ret1 = requests.get(url1)
cont1 = ret1.content
title = re.findall('<td colspan="2">.*?<h1>(.*?)</h1>.*?</td>',cont1,re.S)

cmName = re.findall('<td colspan="2">.*?<h2>.*?<a target="_blank" href=".*?>(.*?)</a></h2>.*?</td>',cont1,re.S)

money = re.findall('<tr>.*?职位月薪：</td>.*?<td valign="top">(.*?)</td>.*?</tr>',cont1,re.S)

position = re.findall('td class=.*?>工作地点：</td>.*?<td.*?<a.*?>(.*?)</a>',cont1,re.S)

print title[0],"+",cmName[0],"+月薪:",money[0],"+工作地点:",position[0]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

J了个X

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用Python从智联招聘自动爬取招聘信息

#coding:utf8import reimport requestsimport urllibfrom lxml import etreecity = urllib.quote("北京") #把utf8编码的\x改为适合网址的%kw = "python"url = """http://sou.zhaopin.com/jobs/searchresult.ashx?\
复制链接

扫一扫