在校大学生用python当爬虫一个月能赚3000吗？

Python程序员小泉

已于 2024-01-06 17:56:28 修改

阅读量621

点赞数

分类专栏： python 程序员文章标签： python 爬虫大学生兼职编程语言

于 2023-02-14 10:03:58 首次发布

本文链接：https://blog.csdn.net/m0_59162248/article/details/129021683

版权

python 同时被 2 个专栏收录

753 篇文章 63 订阅

订阅专栏

程序员

216 篇文章 2 订阅

订阅专栏

自学Python，目前已经月薪过万的爬虫师来答题了！！！

我觉得这个问题，需要看你的爬虫能写到什么程度，同时看你有多少时间来做这份兼职。

作为一个师，平时我的工作除了用Excel做一堆表格分析以外，在学爬虫这件事上，可以说是零编程基础，本来学Python也只是想在数据方面给自己多一些经验，后来发现爬虫真的是非常好的赚钱渠道，也可以拓宽我的数据分析能力。
在这里插入图片描述
当时最初想着可以先自学试试，毕竟前路未卜，也不愿意有过大的投入，朋友把我拉进了他学Python的一个群里，说是有很多大牛，可以指导我们的问题，也可以看看他们日常的一些分享，长长见识。进去发现还真的是非常棒，有些大神是真的牛逼，思路非常清晰，有什么问题都能快速帮我解答。如果你也需要这样的学习群，可以点击下方链接进来哦~

现在，我虽然不能说是通过学习Python发家致富，但是每个月的兼职收入轻轻松松就有5k+，所以不得不说，Python爬虫的学习之路，我选择的还是非常正确的。

看到这里，你是不是想问我到底是上哪里找到的这些高薪兼职？不要急，下面就来告诉你。请存好下面这份兼职攻略，等自己学会了爬虫，就可以直接靠下面的兼职来赚钱了。

接单平台：

下面列举的接单平台，不仅仅是学习爬虫的平台哦，是Python全品类的接单平台，大家只有学过一些Python就都可以去下面这些平台试着接单，都是学习群聊里的大神们推荐给我的，亲测有效。

1.[一品威客]

这是一个比较适合新手的平台，任务根据难度不同，报酬也不太一样，可以选择适合自己的，保证可以完成的任务进行接单，是我学习初期用来练手的平台（千万别让我那时候的甲方爸爸知道这件事）。

对于这个网站，我的建议是，有点基础了就可以来接单了，刚开始可以接一些时间不是特别紧张的任务，慢慢的开始做难一些的。

2.[开源众包]

这个网站看名字就超级专业，当然，任务也并不是都特别难，也有简单的，价格从100~1w不等，当然，1w的那种任务难度也是可想而知的，所以我是有一些基础以后再去这个平台上接单的。

除了上面两个平台以外，像猿急送也是个不错的接单平台，但是这个网站上的任务内容相对比较杂。

注意事项：

要知道，我们学习Python赚的每一分钱都是辛苦钱，这份辛苦由每一根掉落的头发见证，所以在找到相应的兼职以后，一定要注意下面这些问题：

1.薪水

你的收费是税前还是税后，这个非常重要，有时候6个点的税看着不多，但是当基数足够大时，也是一笔不小的钱。

我的报价公式是：工时*时薪+紧急程度+报价，时间越紧报价越高，毕竟熬夜是拿命在换钱。

2.时间

千万不要把时间定的太死，你不能保证自己做出来的东西完美无缺，一旦出现问题，修改需要花费大量的时间，所以在时间设定时，一定要给自己留出足够的时间。

3.需求

相信我，你真的会遇到弄不清楚需求的客户经理，对于这部分人，一定要把需求对清楚，不然很有可能会出现努力白费的现象。

同时，你并不知道找你的公司是不是靠谱，所以可以预留一个小bug，自己记好位置，结算尾款以后再修复bug。

看到这里，你是不是也觉得靠爬虫赚钱还是很有希望的？那么我们要怎么进行爬虫学习呢？下面就开始进行学习内容的干货分享，一定要点赞收藏啊！！！

认识Python爬虫

其实想要学好爬虫，我们需要进行的第一步就是知道我们爬虫到底是什么。简单的说爬虫可以说是一个网站的探测器，模拟人工对于网站进行操作，然后把一些有用的信息带回来。说的专业一点[网络爬虫]需要做的，就是通过制定url，让用户省去人工操作浏览的过程，直接返回给用户他们需要的数据，这个过程简单的说需要下面四个步骤：

查找域名对应的IP地址
向对应服务器发送请求
相应请求，发回网页内容
解析网页内容

听我这么说，是不是觉得有些玄乎，也有些看不明白，没关系，推荐一个非常适合小白的学习群，群里的大神都非常照顾新人，我还是一个小白的时候就进了群，全靠大神们带着才能有今天的成绩。下面是大神的群聊，想学习的同学速度上车呀~

学习爬虫的必须知道的四件事

1熟悉Python编程

Python变成是一种针对[计算机程序设计]的语言，其实就和我们常说的JAVA、C语言一样，都是一种语言。最初应用于编写自动化脚本，后来随着版本的更新，功能也越来越强大。

2.了解HTML

HTML是一种网页语言，但它不属于编程语言，而是一种[标记语言]。所以说HTML就是使用标记来描述网页。

3.了解网络爬虫的基本原理

网络爬虫是引擎抓取系统的重要组成部分，目的就是为了将互联网上的网页下载到本地形成一个镜像备份。画个图方便大家理解：

4.学习使用Python[爬虫库](

requests就是Python实现的简单易用的HTTp库，用起来比[urllib]简介很多。但是因为是第三方库，所以使用以前就需要我们进行cmd安装，找到Python安装路径中的scripts的路径：

完成了上面这些内容，我们才可以真正开始进入Python爬虫的学习。

但是我在这里一定一定要跟大家说的是，Python学习，远没有各种视频广告里说的那么简单，刚开始查资料、看书、了解结构数据、列、表、字典、函数、[控制语句]等（常用的条件语句、[循环语句]）等，真的是学一点忘一点，一定要不断回头进行复习。

下面让我们来看看学习爬虫需要学习的内容有哪些。

1.前端知识

这个比较好理解，就是网页的前端知识，比如HTML5框架、网页的[http请求]，当然，JavaScript、css3这些内容我们需要了解，但不用非常深入学习，只要懂一点必要的内容就可以了。这些内容都不难，完成了这些学习以后，就可以开始爬虫学习了。

2.基础爬虫

这个部分就是我们爬虫学习的基础，主要分为9个模块的知识点：

A. 基础库：urllib模块/requests第三方模块
上文也提到了，urllib模块不如requests第三方模块简洁明了，所以可以更加深入学习一下requests第三方模块，urllib模块做一个简单的了解。
B. 多进程、多线程、协程和分布式进展
C. 网页解析题曲库：xpath/BeautifulSoup4/正则表达式
如果说前两个模块是获取信息，那么这里就是过滤信息，最后留下我们需要的内容。个人比较推荐BeautifulSoup4，更容易掌握，也能够更快实战。
D. 反屏蔽：请求头/代理服务器/cookie
很多网站都会设置反爬虫措施，这部分的学习就是教我们怎么伪装自己，让“敌方”察觉不到我们的存在。
E. 异常：超时处理/异常处理
这部分比较简单，就是遇到异常现象怎么处理
F. 数据储存库：文件系统储存/MySQL/MongoDB
数据储存方式大概就是这三种，它们各有各的特色：
文件系统储存需要运用Python文件操作执行；
MySQL则是用数据库创建的表格进行数据储存；
我最喜欢MongoDB，分布式爬虫就是运用了MongoDB来储存的。
G. 动态网页抓取：Ajax/PhantomJS/Selenium这三个知识点
H. 抓包：APP抓包/API爬虫
I. 模拟登陆的 爬虫

3. 框架爬虫

一般我们需要学习的框架就是“ scrapy 框架”和“pyspider 框架”，前者比较主流，而后者比较人性化。

当然，框架也不是只有这两种，但是别的几乎用不到。

4. [分布式爬虫]

这个部分需要学到的知识点就是用Python操作Redis 基础命令和 scrapy-Redis。

5. 突破反爬虫

这部分知识点比较多，主要有以下几个：

useragent 池/禁用 cookies /设置下载延时和自动限速/代理 IP 池/ tor 代理/分布式[下载器]

上面就是学习爬虫的基本路线，现在看起来觉得迷茫没关系，下面这个大神群里经常会分享一些爬虫的相关知识点，还会带领我们进行实操。