python爬取猎聘网数据并且存入数据库

本文介绍了作者作为爬虫初学者,使用Python爬取猎聘网静态页面数据并存储到数据库的过程。虽然目前作者还不擅长模拟登录和使用IP代理等高级技巧,但承诺后续将分享更多高级爬虫知识。
摘要由CSDN通过智能技术生成

  目前我还是爬虫小白,只是会简单通过解析网页数据来保存,还不会模拟登陆,ip代理等技巧,这边只是爬取静态网页,对于动态生成的内容,我就没折了 ,由于最近工作比较忙就没有进一步学习高级爬虫技巧,大伙先勉强看着,后面学会了,给大家分享高级技巧。代码如下:

'''
爬取猎聘网职位信息做数据分析
'''
from bs4 import BeautifulSoup
import requests
import time
import pymongo

'''
保存数据库方法:
'''
def saveToDB(json):
    print("正在保存到数据库")
    client = pymongo.MongoClient("mongodb://localhost:27017/")
    db = client.LiePinData
    data = db.android
    data.insert_one(json)



'''
爬取主程序
'''
nextUrlBase = "https://www.liepin.com/zhaopin/?init=-1&headckid=870b81c75324cfd6&fromSearchBtn=2&sfrom=click-pc_homepage-centre_searchbox-search_new&ckid=870b81c75324cfd6&degradeFlag=0&key=android&siTag=wxsyNkzhnKj80VCkF-zOWA~fA9rXquZc5IkJpXC-Ycixw&d_sfrom&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

景兄弟1366

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值