![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫从0到1
文章平均质量分 83
奶香菠萝包
这个作者很懒,什么都没留下…
展开
-
python爬虫从0开始!小白一起学!(2)
所以捏,当你用python爬虫的时候,Python文件就给网页发送一个消息啦,告诉他,我是爬虫,我来找你了,现在很多网站有自己的反爬机制,自然不会,让你进去,所以就会拒绝访问,让你填验证码什么啦。这个时候呢,咱们就需要伪装一下,获取,网页直接访问的用户代理信息,把他封装到一个请求头(headers)字典里。将这个值以字典的格式存进去,然后做为发送请求时的参数。接收方如果也是Python开发的,可以使用 json库中的 loads方法,把json格式的字符串变为 Python中的数据对象。原创 2023-05-11 00:20:05 · 458 阅读 · 2 评论 -
python爬虫从0开始!小白一起学!(1)
主要目录包括一.静态页面与动态页面的区别在最最开始学习爬虫的时候,我就不太懂,为什么有的页面可以直接获取,有的还需要去控制台的网络模块抓包。取决于是动态页面还是静态页面啦!原创 2023-05-06 00:58:54 · 256 阅读 · 1 评论