Python网络爬虫和信息提取（一）

最新推荐文章于 2023-12-20 23:00:55 发布

佳佳（5.11）

最新推荐文章于 2023-12-20 23:00:55 发布

阅读量714

点赞数

分类专栏：爬虫文章标签：网络爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cyh153296/article/details/75127202

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这是我在mooc中听课的一部分截图，主要是方便以后自己学习！其中主要从以上几个方面来讲解python网络爬虫和信息提取。

requests库的七个常用方法，其中get方法经常使用到。截图很清晰明了了。

其中r=resquests.get("http://www.baidu.com")中的r是一个response对象，这句话用于链接对应的url，还有就是那个返回值200表示正确链接了。否则就是错误的。

这些异常都是在做爬虫工作中的一些常见异常，如果出现对应的错误，再找对应的解决办法。（后续补充）

以上的代码主要是为了获取html的一个文本信息。

我们可以理解为我们客户向云端通过URL链接，然后向通过get和head方法来获取一些信息。

r,text得到具体的文本数据。

这就是之前说的那七个常见方法。

把一些键值对增加到对应的url中，并且可以再增加一些参数，进一步获取链接，比如一些网站的进一步链接。。。

http://www.icourse163.org/learn/BIT-1001870001?tid=1001962001 这就是之前的听课的一部分内容。。。yhk

佳佳（5.11）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。