自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 数据处理(上次爬取51job的数据中有错误数据)——拆分错误数据

数据拆分目标代码目标因为上次爬取51job的职位信息中有错误数据,需要将错误数据从中导出。如下图:出现图中数据的原因是:该职位没有学历要求导致,所以需要将这些错误数据拆分出来。代码使用pandas处理数据:import pandas as pd因为我存储数据的csv文件与我py文件同级,所以可以直接调用filepath = '51job数据分析.csv'# 读取csv文件...

2019-11-29 17:06:34 414

原创 新手初试python爬取51job(前程无忧)的职位信息

目标:搜索关键字:数据分析地点: 北上广深URL:https://search.51job.com/list/010000%252C020000%252C030200%252C040000,000000,0000,01,9,99,%25E6%2595%25B0%25E6%258D%25AE%25E5%2588%2586%25E6%259E%2590,2,1.html?lang=c&...

2019-11-28 12:36:49 2357 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除