自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 requests - 简易网页采集器

requests - 简易网页采集器 需求:爬取搜狗指定词条对应的搜索结果页面 思路分析: 打开搜狗搜索,输入关键词:爬虫,打开网页搜狗搜索-爬虫,这个页面就是需要采集的内容了。 步骤: 1、导入模块 2、指定url 3、发送请求,获取数据 4、保存数据 首先做一下UA伪装(将爬虫装成浏览器),打开网页,右键检查,找到network,随便点击一个加载的内容,在headers中找到user-agent,复制一下,封装到字典里。 观察当前页面的url,发现是由域名+对应请求的参数query构成的。将quer

2021-02-18 12:28:09 173

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除