Requests爬取网页内容

Requests的简单用法

Requests主要方法:

  • requests.request() #构造一个请求,支撑以下各方法的基础方法
  • requests.get() #get方法获取网页
  • requests.head() #获取网页头信息的方法,对应HTTP的HEAD
  • requests.post() #post方法获取网页信息
  • requests.put() # put方法获取网页信息(一般用不到)
  • requests.patch() # patch方法请求网页信息(一般用不到)
  • requests.delete() #向HTML网页提交删除请求

Requests.get的用法:

import requests	# 导入方法
r = requests.get(url)		#发送请求获得相应

Response对象的属性:

  • r.status_code # 返回的状态码,不同状态码代表不同意思,200表示返回正常。
  • r.text #返回对象的文本内容
  • r.content #猜测返回对象的二进制形式
  • r.encoding #分析返回对象的编码方式
  • r.apparent_encoding #相应内容编码方式(备选编码方式)
  • r.raise_for_status() #抛出异常
爬取豆瓣网页信息

分析豆瓣短评网页是动态加载还是静态加载

  1. 在谷歌浏览器中进制js
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值