自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

转载 python拉勾网数据分析-北京市数据分析师职位

导读 针对爬取的北京市数据分析师岗位数据进行数据分析,如岗位分布的地区情况、工作经验要求、公司融资情况、学历要求及薪资水平。数据中存在着实习岗位,如果不想将其算在数据分析里可以将他们删除。 数据: 链接:https://pan.baidu.com/s/1dMTPlCLT0CcbOQFCHLv37Q 提取码:ct01 df.drop(df[df['职位名称'].str.con...

2019-08-13 20:50:00 290

转载 python拉勾网数据分析-爬虫阶段

导读 从今年1月份开始拉勾网反爬能力加强(好像是5号,之后就需要模拟登录和验证码),后来读了一篇文章解决了这个问题(没找到之前历时4个月很想哭,,,好不容易找到一个,然而一个code生成一个文件需要80分钟。。。别问我爬了几个o(╥﹏╥)o),解决方法是伪装请求头,并将session更新进行抓取,只需很短的时间。80分钟的代码用的selenium,可见两种爬虫方法各有各的不同及优势,根...

2019-08-04 21:26:00 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除