- 博客(2)
- 收藏
- 关注
原创 Python 爬虫学习笔记(二)
分析网页 我们平时使用浏览器来访问网页,实质上来看,就是通过一个客户端经过网络连接访问了服务器端,访问前,我们的页面没有任何内容,那么这些内容必然都是从服务器端传输过来的。爬虫的工作就是利用编程的方式自动化地从服务器端获取并分析数据,得到我们需要爬取的内容。 因此想要利用爬虫获取内容,首先需要我们分析目标网站页面,了解其数据排列方式,知晓其数据传输过程,从而能够制订正确有效的爬取途径。 以CSDN中我本人之前的一篇文章为例 https://blog.csdn.net/qq_26292987/article/
2020-08-25 17:00:40 180 1
原创 Python 爬虫学习日记(一)
Python 爬虫学习日记(一) 爬取百度链接 其对链接中关键词wd进行了url编码,url中pn可以改变页面 详细内容在链接: https://blog.csdn.net/qq_41453482/article/details/100608870 关键代码: import urllib.parse key={‘wd’:‘B站’} key=urllib.parse.urlencode(key) print(key) wd=B%E7%AB%99 百度搜索URL参数含义:https://blog.csdn.
2020-07-27 11:30:07 153
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人