爬虫模块scrapy框架命令，requests模块，retrying模块，requests中session，response常用属性，json.dumps，json.loads，json.load

最新推荐文章于 2022-07-11 17:30:37 发布

xiaobai_IT_learn

最新推荐文章于 2022-07-11 17:30:37 发布

阅读量338

点赞数

分类专栏：爬虫笔记文章标签：爬虫 scrapy request response json和dict

本文链接：https://blog.csdn.net/xiaobai_IT_learn/article/details/101039909

版权

1.scrapy框架

创建项目：scrapy startproject 项目名
创建爬虫：cd 项目名下  ，scrapy genspider 爬虫名 allowed_domains(网站)
开启爬虫：scrapy crawl 爬虫名

2.requests模块

proxies = {
   "http": "http://127.0.0.1:8080"}  # proxies格式，key为协议，value为：协议+ip地址+端口
headers = {
   "User-Agent": "xxx", "Cookie": "cookie_str"}  # cookie可以写在headers中，此时cookie为str
cookie_dict = {
   i.split("=")[0]:i.split("=")

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xiaobai_IT_learn

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫模块scrapy框架命令，requests模块，retrying模块，requests中session，response常用属性，json.dumps，json.loads，json.load

1.scrapy框架创建项目：scrapy startproject 项目名创建爬虫：cd 项目名下，scrapy genspider 爬虫名 allowed_domains(网站)开启爬虫：scrapy crawl 爬虫名
复制链接

扫一扫