![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 68
爬虫新手入门及学习纪录(合集)
Z_MYM_Z
这个作者很懒,什么都没留下…
展开
-
爬虫【三】数据解析
解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储。进行指定标签的定位将标签或者标签对应的属性中存储的数据进行提取(解析)原创 2023-08-03 16:29:00 · 504 阅读 · 0 评论 -
爬虫实战 报错解决方法合集
通过可知,当前页面的编码是ISO-8859-1,但是网页实际需要的是utf-8,所有我们需要进行转码。添加代码查看网页的编码方式。运行结果显示,网页编码是ISO-8859-1的模式。在查看源码的编码模式,查看charset可知源码的编码模式是utf-8。原创 2023-08-14 15:32:09 · 500 阅读 · 0 评论 -
爬虫【二】requests模块
爬虫resquests模块实战编码原创 2023-07-28 15:07:17 · 510 阅读 · 0 评论 -
爬虫【一】
robots.txt协议:规定了网站中哪些数据可以被爬虫爬取,哪些数据不可以被爬取。反反爬策略:爬虫程序可以通过制定相关的策略或者技术手段,破解门户网站中具备的反爬机制,从而可以获取门户网站中相关的数据。反爬机制:门户网站,可以通过制定相应的策略或者技术手段,防止爬虫程序进行网站数据的爬取。Rquests库是Python中发起HTTP请求的库。https协议:安全的超文本传输协议(http不安全)加密方式:①对称秘钥加密②非对称秘钥加密③证书秘钥加密。— 概念:服务器和客户端进行数据交互的一种新式。原创 2023-07-26 13:58:44 · 1069 阅读 · 0 评论