第十八章 python爬虫

VIP文章黎扶澈

已于 2022-08-04 07:52:33 修改

阅读量502

点赞数 2

分类专栏：光荣之路笔记 python 文章标签： python 爬虫

于 2022-08-02 17:31:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22895113/article/details/126121412

版权

目录

一、requests包

1.2 get方法请求

1.2.1 使用get方法获取请求结果

1.2.2 在get请求中使用参数

1.2.3 在get请求中使用列表参数

1.3 post方法请求

1.4 其他方法

1.5 获取json的返回结果

1.6 定制请求头

1.7.1 获取状态码

1.7.2 判断状态码

1.7.3 非200时候抛出异常代码

1.8 获取响应头

1.9 获取cookie

1.9.1 获取cookie

1.9.2 发送自定义的cookie值

1.9.3 设定跨多个路径的cookie值

1.10 请求超时

1.11.1 获取重定向的 url

1.11.2 禁止重定向

1.12.1 跨请求保存参数的方法

1.12.2 会话也可用来为请求方法提供缺省数据

URL 参数拼接及 get、post 请求

服务器返回结果

带有 header 发送数据

设定超时时间

服务返回结果保存为 html

下载一张图片

创建 beautifulsoup 对象

输出 beautifulsoup 对象及解析

四大对象种类分析

html 结构化分析

遍历文档结构查询

三、实战练习

3.1 抓取搜狐网页连接并做分析

一、requests包

1.1 安装

py -3 -m pip install requests

1.2 get方法请求

1.2.1 使用get方法获取请求结果

#encoding=utf-8

import requests

r = requests.get('https://www.sohu.com/')
print(r) #返回<Response [200]>
print(r.status_code) #返回请求的Http状态码
print(r.url) #获取请求的url
print(r.text[:200]) #获取请求的返回内容,str类型，直接可以编程用
print(t

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
第十八章 python爬虫

requests、urllib、bs4模块讲解
复制链接

扫一扫

专栏目录

黎扶澈 CSDN认证博客专家 CSDN认证企业博客

码龄10年

48: 原创

10万+: 周排名

178万+: 总排名

5万+: 访问

: 等级

597: 积分

36: 粉丝

35: 获赞

5: 评论

195: 收藏

私信

关注

分类专栏

光荣之路 35篇
笔记 25篇
测试理论 5篇
练习题 11篇
python 41篇
Linux 2篇
MYSQL 1篇

最新评论

random函数汇总
黎扶澈: 不好意思，之后转行去了，很久没用这个。我查阅了python官方文档，关于cum_weights的解释有误，它其实是叫累积权重。在python内部，相对权重在进行选择之前会转换为累积权重，例如，相对权重``[10, 5, 30, 5]``相当于累积权重``[10, 15, 45, 50]``。所以例子里面[70,10,5,15]这个数值是有误的
random函数汇总
山山而川2020 回复 mavwang: w权重为正数，即为真。yzw权重为负数，即为假。相当于w为百分百权重，其余权重为0
random函数汇总
mavwang: [code=python] >>> for i in range(10): ... print(random.choices(['x','y','z','w'],cum_weights=[70,10,5,15],k=1)) ... ['w'] ['w'] ['w'] ['w'] ['x'] ['x'] ['w'] ['x'] ['x'] ['x'] [/code] 以上这段random.choices的代码里累加权值为cum_weights=[70,10,5,15]，这个权值并不符合累加关系。但仍然是能跑出来结果的，请问这种情况下xyzw的权值分别是多少呢？
random函数汇总
mavwang: 请问下random.choice那部分里面的如下示例： [code=python] for i in range(10): print(random.choices(['x','y','z','w'],cum_weights=[70,10,5,15],k=1)) [/code][code=python] 这里面累加权重值为cum_weights=[70,10,5,15]，并没有累加关系，这个权值怎么理解？而且代码也允许成功了，这个权值下xyzw的相对权值分别是多少呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。