python 抓百度招聘信息,将搜索结果解析下来,用来跟踪招聘趋势数据,免费数据变为有用的东东

准备着手抓取网页上的免费信息,用来产生一些有价值的趋势信息。第一次发现招聘信息可以反映一个行业的发展状况,是一个不错的趋势指标。

举例来说明:

下面代码将查询百度的某一个行业的招聘关键字,例如大数据的招聘信息,如果将这个数据每天的都记录下来,就可以追踪大数据行业的发展趋势。


#encoding:utf8

import urllib2
import re
__author__ = 'jason'
def read_job_from_baidu(url_baidu):
    url = url_baidu
    response = urllib2.urlopen(url)#访问百度
    result = response.read()
    result_str= result.decode("gbk")#从gbk转换为unicode
    job_count_str=re.search(u"共找到"+".*?"+u"个相关职位",result_str)#搜索职位的特征字符串
    search_result=job_count_str.group()
    search_result=search_result.replace(u"共找到","")#去掉无关字符
    search_result=search_result.replace(u"个相关职位","")
    #print search_result
    return search_result


if __name__ == "__main__":
    big_data_url="http://opendata.baidu.com/zhaopin/?ie=gbk&p=mini&rn=20&wd=%D5%D0%C6%B8+%B4%F3%CA%FD%BE%DD"
    result=read_job_from_baidu(big_data_url)
    print result #后续可以将这个结果保存到数据库,将上述稍加改造就可以用来跟踪各行各业的求职相关的趋势信息,每天都保存下来,经过时间的积累,你就能得到一个很好的趋势分析数据。是不是很厉害?
    #print job_count_str.group()
    #print result
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值