爬虫
Traviscxy
这个作者很懒,什么都没留下…
展开
-
python爬虫学习第一课之爬虫基本原理掌握
1.预备知识:1.1HTTP原理:1.1.1URLURL又称为网络资源定位符,顾明思以这是一个标识符,用于定位网络的资源,而对于客户端的用户而言网络资源即网页界面呈现出来的东西,而要找到这样的资源就需要一个标识符,比如我们想通过浏览器进入淘宝PC端界面,我们就可以输入淘宝的网址,浏览器通过网址会生成一个URL,从而找到淘宝网的界面显示在浏览器窗口。URL包含了网址也就是域名信息,同时还...原创 2019-04-18 10:10:14 · 326 阅读 · 0 评论 -
python爬虫学习第二课之基础库urllib的使用
Urllib库的使用1.安装 pip install urllib2.发出请求2.1urlopen()urllib.request 模块提供了最基本的构造HTTP请求的方法,利用它可以模拟浏览器的请求发起过程,并获Resonse,下面以python官网为例,发出请求并urlopen获取响应。输出结果则是该网站首页的源代码,类型为HTTPResponse对象,还可以通过调用statu...原创 2019-04-18 10:46:09 · 569 阅读 · 0 评论 -
python爬虫学习第三课之基础库Requests的使用
1.安装 pip install Requests2.请求2.1使用get方法发出请求,获取响应,并是输出响应内容。import requestsurl = 'https://www.baidu.com/'r = requests.get(url)print(type(r))print(r.status_code)print(type(r.text))print(r.t...原创 2019-04-18 11:29:40 · 229 阅读 · 0 评论