"新方法"爬虫==拉勾网招聘信息

一种自己以前完全没接触过的方法

只要有你,每次都看我的锁薇女神老师的教学视频

还有两年快毕业了,所以对毕业工作的事情很是上心啊

  • 这种方法还没弄清楚呢,所以呢趁着还有印象先把记录下来
  • 以免自己的脑子给忘记了!!!

先贴上源代码

#coding:utf-8
import requests,xlwt,json
items = []#设置为空,方便存储
pn=1
def get_content(pn):
    url = 'http://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false'
    data = {'first':'true',
            'pn':pn,
            'kd':'python'}
    html = requests.post(url,data).text
    html = json.loads(html)
    # print(html)
    for i in range(14):
        item = []
        item.append(html['content']['positionResult']['result'][i]['positionName'])#招聘职位
        item.append(html['content']['positionResult']['result'][i]['companyFullName'])#公司名称
        item.append(html['content']['positionResult']['result'][i]['salary'])#薪资
        item.append(html['content']['positionResult']['result'][i]['city'])#地点
        item.append(html['content']['positionResult']['result'][i]['positionAdvantage'])#福利
        items.append(item)
    # print(items)
    # for i in items:
    #     print(i)
    return items
items = get_content(pn)

def excel_write(items):
    newTable = 'lagoutext.xls' #表的名称
    wb = xlwt.Workbook(encoding='utf-8') #创建Excel文件的,,,设置编码
    ws = wb.add_sheet('python_job') #创建表的名称
    headData = ['招聘职位','公司名称','薪资','地点','福利']  #制作表头
    for hd in range(0,5):
        ws.write(0,hd,headData[hd],xlwt.easyxf('font:bold on')) # 0行  hd列

    index = 1
    #将爬虫数据写入 Excel 表格
    for item in items:  #招聘信息
        for i in range(0,5):
            # print(item[i])  #每一行的信息
            ws.write(index,i,item[i])  #行 列 数据
        index+=1
        wb.save(newTable)
if __name__ == '__main__': #判断文件入口
    items = get_content(pn)
    excel_write(items)`

改天继续吧这个弄懂,先放在这,以免忘记!!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值