爬虫学习
蠕动在爬虫之路上
这个作者很懒,什么都没留下…
展开
-
Python 爬虫学习笔记(二)
分析网页我们平时使用浏览器来访问网页,实质上来看,就是通过一个客户端经过网络连接访问了服务器端,访问前,我们的页面没有任何内容,那么这些内容必然都是从服务器端传输过来的。爬虫的工作就是利用编程的方式自动化地从服务器端获取并分析数据,得到我们需要爬取的内容。因此想要利用爬虫获取内容,首先需要我们分析目标网站页面,了解其数据排列方式,知晓其数据传输过程,从而能够制订正确有效的爬取途径。以CSDN中我本人之前的一篇文章为例https://blog.csdn.net/qq_26292987/article/原创 2020-08-25 17:00:40 · 184 阅读 · 1 评论 -
Python 爬虫学习日记(一)
Python 爬虫学习日记(一)爬取百度链接其对链接中关键词wd进行了url编码,url中pn可以改变页面详细内容在链接:https://blog.csdn.net/qq_41453482/article/details/100608870关键代码:import urllib.parsekey={‘wd’:‘B站’}key=urllib.parse.urlencode(key)print(key)wd=B%E7%AB%99百度搜索URL参数含义:https://blog.csdn.原创 2020-07-27 11:30:07 · 160 阅读 · 0 评论