爬虫:用Python爬取招聘职位信息&职位需求分析

本文利用Python爬虫从智联招聘获取数据分析岗位信息,通过数据清洗和提取,分析了全国各地区薪资分布、学历与薪资关系以及工作经验对薪资的影响。结果显示,一线城市如北京、上海、深圳等地需求旺盛,平均薪资集中在10-20k,博士学历薪资普遍较高,大公司更倾向于招聘数据分析师,尤其重视高学历人才。
摘要由CSDN通过智能技术生成

用Python爬取智联招聘网站“数据分析”相关岗位信息

# _*_ coding: utf-8 _*_
from bs4 import BeautifulSoup
import requests
import csv
import json
import pandas as pd
import numpy as np

#定义函数:请求下载页面源代码
def download(url):
    headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:51.0) Gecko/20100101 Firefox/51.0'}
    req=requests.get(url,headers=headers)
    return req.text
#定义函数:解析网页内容,抓取职位信息
def get_content(html):
    soup=BeautifulSoup(html,'lxml')
    body=soup.body
    data_main=body.find('div',{
  'class':'newlist_list_content'})#找div标签的特定属性
    tables=data_main.find_all('table')

    zw_list=[]
    for i,table in enumerate(tables):
        if i==0:
            continue
        temp=[]
        tbs=table.find('tr').find_all('td')#find_all形成的是list
        zwmc=tbs[0].find('a').get_text()
        gsmc=tbs[2].find('a').get_text()
        zwyx=tbs[3].get_text()
        gzdd=tbs[4].get_text()

        bt_brief=table.find('tr',{
  'class':'newlist_tr_detail'})
        brief=bt_brief.find('li',{
  'class':'newlist_deatil_two'}).get_text()

        temp.append(zwmc)
        temp.append(gsmc)
        temp.append(zwyx)
        temp.append(gzdd)
        temp.append(xl)

        zw_list.append(temp)

    return zw_list
  • 4
    点赞
  • 70
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值