Requests实例

最新推荐文章于 2024-04-09 15:07:00 发布

qiki_tang

最新推荐文章于 2024-04-09 15:07:00 发布

阅读量451

点赞数

分类专栏： python网络爬虫文章标签： python 网络爬虫库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiki_tangmingwei/article/details/62431124

版权

python网络爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文是基于中国大学MOOC教程中《Python网络爬虫与信息提取》做的学习笔记，笔者在这里做一个分享

环境（python 2.7.6）

【实例1：网络图片的爬取和存储】

将网页 http://image.nationalgeographic.com.cn/2017/0315/20170315045734460.jpg 中的图片爬取下来：

Shell代码如下：

图片爬取全代码：

爬取结果：

其中第二张图是shell端爬取出来的结果。

该代码不仅对图片，还对网站上所有二进制的资源格式（图片、视频、动画等），都可以用同样的代码获取它。

【实例2：网站关键词提交】

用python的requests库自动向搜索引擎提供关键词并且获得相应的搜索结果。

关于搜索引擎关键词提交接口：

百度的关键词接口：http://www.baidu.com/s?wd=keyword

360的关键词接口：http://www.so.com/s?q=keyword

在这两个关键词接口中，替换当中的keyword就可以提交它的关键词搜索了。

【重点】构造一个包含关键词的URL链接-----params可以向URL中增加相关的内容（示例中假设搜索的关键词是Python）

Shell窗口

搜索的全代码如下：

【实例3：商品页面的爬取---以京东为例】

全代码

结果（仅截取部分）

【实例4：IP地址归属地自动查询】

IP地址查询可通过 www.ip138.com 来查询IP地址归属地

通过IP138网站提交IP地址的URL链接（接口）：http://m.ip138.com/ip.asp?ip=ipadderss

Ipaddress即为提交给网页的参数，网页根据这个参数返回这个地址对应的位置。

本示例中对北京市海淀区进行查询（该URL在IP138搜索结果如下）

Shell窗口

全代码：

爬取结果（部分截图）

【后记】网络中的任何内容都与URL相匹配，对网站的搜索查询等操作都是通过访问它的URL实现的。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Requests实例

本文是基于中国大学MOOC教程中《Python网络爬虫与信息提取》做的学习笔记，笔者在这里做一个分享环境（python 2.7.6）【实例1：网络图片的爬取和存储】将网页 http://image.nationalgeographic.com.cn/2017/0315/20170315045734460.jpg 中的图片爬取下来：Shell代码
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。