python爬取猎聘网数据并且存入数据库

景兄弟1366

于 2019-05-13 23:54:24 发布

阅读量2k

点赞数 1

分类专栏： python 文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012539700/article/details/90183893

版权

本文介绍了作者作为爬虫初学者，使用Python爬取猎聘网静态页面数据并存储到数据库的过程。虽然目前作者还不擅长模拟登录和使用IP代理等高级技巧，但承诺后续将分享更多高级爬虫知识。

摘要由CSDN通过智能技术生成

目前我还是爬虫小白，只是会简单通过解析网页数据来保存，还不会模拟登陆，ip代理等技巧，这边只是爬取静态网页，对于动态生成的内容，我就没折了，由于最近工作比较忙就没有进一步学习高级爬虫技巧，大伙先勉强看着，后面学会了，给大家分享高级技巧。代码如下：

'''
爬取猎聘网职位信息做数据分析
'''
from bs4 import BeautifulSoup
import requests
import time
import pymongo

'''
保存数据库方法:
'''
def saveToDB(json):
    print("正在保存到数据库")
    client = pymongo.MongoClient("mongodb://localhost:27017/")
    db = client.LiePinData
    data = db.android
    data.insert_one(json)



'''
爬取主程序
'''
nextUrlBase = "https://www.liepin.com/zhaopin/?init=-1&headckid=870b81c75324cfd6&fromSearchBtn=2&sfrom=click-pc_homepage-centre_searchbox-search_new&ckid=870b81c75324cfd6&degradeFlag=0&key=android&siTag=wxsyNkzhnKj80VCkF-zOWA~fA9rXquZc5IkJpXC-Ycixw&d_sfrom&#

最低0.47元/天解锁文章

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

景兄弟1366 CSDN认证博客专家 CSDN认证企业博客

码龄11年

184: 原创

3万+: 周排名

198万+: 总排名

61万+: 访问

: 等级

5668: 积分

219: 粉丝

164: 获赞

152: 评论

779: 收藏

私信

关注

热门文章

分类专栏

最新评论

APP流量变现之穿山甲广告平台接入
2301_80043505: 帮忙联系，我要对接
快上车，老司机带你实现后台录像功能
景兄弟1366: 哈哈，好久没上这个了，后面有时间补上
alibaba pc safe service无法删除，一直在后台运行怎么办？
普通网友: 方法如下 1、win+s打开搜索框，输入服务（切记以管理员方式运行），找到Alibaba PC Safe Service——》属性，然后启动类型设置为手动，再把恢复那里全部改成无操作 ——》确定。 2、win+s打开搜索框，输入命令提示符（切记以管理员方式运行），键入 sc delete AlibabaProtect，回车就OK了，这时你会发现服务仍然在运行，而且文件夹仍然无法删除，这时关机重启就行了。 3、开机后，打开任务管理器没有发现Alibaba PC Safe Service进程，说明成功关闭了，这时你就可以删除Alibaba PC Safe Service了。 ———————————————— 版权声明：本文为CSDN博主「qq_43612822」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/qq_43612822/article/details/106601735
轻量级阅读Markdown文件-----chorme插件markdown-viewer-3.9
Sapsunny: 写得很棒，装好啦
快上车，老司机带你实现后台录像功能
tp1048440489: RecordApp这类留着自己吃吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

景兄弟1366 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。