自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 python爬取拉勾网公司信息(您操作太频繁,请稍后访问)

最近爬取拉勾网上的公司信息碰到了很多问题,但是都一一解决了。作为一个招聘网站,他的反爬措施做的还是很好的。为了调查招聘网站上有多少公司,以及公司信息,并把公司信息存入MongoDB数据库中。先上运行成功代码:import requests import json,time,randomimport pymongofrom lxml import etree #导入需要用到...

2019-06-05 23:23:58 3901 1

原创 (已解决)'gbk' codec can't encode character '\u2022' in position 545262: illegal multibyte sequence

html=requests.get(url,headers=headers)html.encoding=('utf-8')with open('网页源代码.html','w')as f: f.write(html.text)上面代码运行后报错:UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in po...

2019-06-03 14:50:28 40701 8

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除