- 博客(2)
- 收藏
- 关注
转载 python拉勾网数据分析-北京市数据分析师职位
导读 针对爬取的北京市数据分析师岗位数据进行数据分析,如岗位分布的地区情况、工作经验要求、公司融资情况、学历要求及薪资水平。数据中存在着实习岗位,如果不想将其算在数据分析里可以将他们删除。 数据: 链接:https://pan.baidu.com/s/1dMTPlCLT0CcbOQFCHLv37Q 提取码:ct01 df.drop(df[df['职位名称'].str.con...
2019-08-13 20:50:00 297
转载 python拉勾网数据分析-爬虫阶段
导读 从今年1月份开始拉勾网反爬能力加强(好像是5号,之后就需要模拟登录和验证码),后来读了一篇文章解决了这个问题(没找到之前历时4个月很想哭,,,好不容易找到一个,然而一个code生成一个文件需要80分钟。。。别问我爬了几个o(╥﹏╥)o),解决方法是伪装请求头,并将session更新进行抓取,只需很短的时间。80分钟的代码用的selenium,可见两种爬虫方法各有各的不同及优势,根...
2019-08-04 21:26:00 125
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人