拉勾网爬虫-python语言实现

本文介绍了一个使用Python实现的拉勾网Python职位爬虫,爬取了北京地区的招聘岗位信息,包括公司名称、薪资、职位描述、公司地址,并将数据存储到12345.txt文件中。
摘要由CSDN通过智能技术生成
以下实现拉勾网上面的北京python的招聘岗位的相关信息,包括公司名称,工资,公司简单介绍,公司地址
初始页面为http://www.lagou.com/zhaopin/Python/?labelWords=label
文件存储在同一个目录下的12345.txt中
#coding=utf-8
import urllib2
from bs4 import BeautifulSoup
#定义一个伪装的头文件
sendHeaders = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0',
    'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
    'Connection':'keep-alive'
}
#临时存储文件为
saveFile = open('12345.txt','a+')
k=1  #统计一共的味信息数量
for i in range(1,31):        # 一共就30页 每次加一个页面,urltemp 后面会+1
    urltemp= 'http://www.lagou.com/zhaopin/Python/'
    url = urltemp+str(i)+"?filterOption=3"   #  翻页操作&
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值