![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python爬虫
文章平均质量分 72
小爬虫Py
Python爬虫学习,从入门到放弃
展开
-
爬虫入门(五):下载豆瓣电影信息
哈喽,大家好,我是小爬虫,上一节我们讲了如何爬取百度翻译实现自己的翻译程序,没有学习过的可以进入专栏读进行学习。今天我们再次使用requests来实现一个案例:下载豆瓣电影喜剧排行榜信息,包含电影名称,上映时间,评分。豆瓣页面分析首先我们打开豆瓣电影喜剧排行榜页面,查看我们需要的数据是在页面源代码里面还是在js中请求的。我们首先进入源代码页面,搜索关键字‘美丽人生’,发现源代码里面并没有电影相关的信息,说明我们需要的数据是经过js请求而来的。接下来我们进入浏览器调试工具,寻找这些电影信息是通过哪原创 2021-11-28 18:47:54 · 833 阅读 · 0 评论 -
爬虫入门(三):使用requests爬取搜狗搜索页面
哈喽,大家好,我是小爬虫,上一节我们讲了Python基础语法的学习,不知道大家有没有学废呢。今天我们要学一个非常有用的网络请求的库,这个库在我们以后的爬虫中几乎是都会用到,这个库就是:requestsrequests简介在介绍requests之前,我们先简单讲一讲urilib。其实urilib是Python内置的网络请求框架,我们使用urilib来进行网络请求非常简单,只需要一句resp = urlopen("http://www.baidu.com")而requests 是⽤Python语⾔编写原创 2021-11-27 11:38:25 · 2571 阅读 · 2 评论 -
爬虫入门(二):Python基础
哈喽,大家好,我是小爬虫,上一节我们讲了爬虫的基本介绍和学习路线,那么从今天开始我们正式进入学习。今天我们讲讲Python基础语法,这是学习爬虫的基础,因为后面学习的爬虫程序都是Python语言来写的。学习地址关于Python语法,如果你对Python已经比较熟悉了,那可以直接跳过这一篇文章,如果你不是很熟悉,这里我推荐一个学习的网站:菜鸟教程 Python 3教程这个网站将Python知识整理地非常全面。如果你有其他编程语言基础,如C语言、C++或Java等,那么基本将这个网站过一下,将其中的d原创 2021-11-22 23:32:18 · 465 阅读 · 0 评论 -
爬虫入门(一):爬虫简介
哈喽,大家好,我是小爬虫,从今天开始,我们进入一个全新的领域——Python爬虫。什么是爬虫?爬虫能干什么?如何学习爬虫?这将是我们这个系列文章主要解决的几个问题。什么是爬虫爬虫,也称网络爬虫,又称网络机器人,可以按照我们所写的爬虫算法规则,自动化浏览、获取网络中的信息。而使用Python可以很方便地编写出爬虫程序,进行互联网信息的自动化检索。简单来说,我们使用浏览器获取的数据,也可以使用爬虫程序来获取到。爬虫能做什么举个例子,我们每天使用的百度、谷歌搜索引擎,其内容其实都是来自于爬虫。比如百度原创 2021-11-21 23:11:43 · 712 阅读 · 0 评论