自学python推荐书籍 知乎-在知乎上学 Python - 爬虫篇

知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发现了我们编程教室,我自己也经常会通过知乎去寻求一些专业知识的解答和参考。

之前,为了让大家能更好地挖掘知乎上有价值的信息,我们做了一个索引,把编程入门相关的一些问答和文章做了整理:

文中曾立下FLAG说之后会整理爬虫、数据分析、机器学习等方面的索引,然而却一拖再拖。好在现在,有同学帮我们做了后续整理,今天就把“爬虫篇”分享给大家。

注意:由于微信文中不能直接跳转外部链接,因此建议点击文末的“阅读原文”,收藏知乎原文。

有很多人正在入门Python爬虫,学习Python爬虫。在这个过程中,会遇到很多难题,许多小伙伴都会去寻找答案,但是因为答案的纷繁复杂和种类多样,往往要花上好些时间。

所以我通过整理知乎上关于Python爬虫的精彩回答文章和教程,制作一篇关于Python爬虫的索引,包括:

入门指南-教程资源-框架工具-爬虫实例-专栏索引

大家有什么好的建议和资源也可以留言提出。

入门指南:

1.如何入门Python爬虫?—谢科的回答

https://www.zhihu.com/question/20899988/answer/24923424

(简介:爬虫怎么工作以及怎么在python实现。)

2.爬虫基本原理

https://zhuanlan.zhihu.com/p/35324806

(简介:给有一些有python基础,但是对爬虫一无所知的人)

3.Python爬虫入门

第一讲:Python爬虫|Python爬虫入门(一):基本

https://zhuanlan.zhihu.com/p/21377121?refer=xmucpp

第二讲:Python爬虫|Python爬虫入门(二):请求

https://zhuanlan.zhihu.com/p/21394571

第三讲:Python爬虫|Python爬虫入门(三):解析

https://zhuanlan.zhihu.com/p/21442500

第四讲:Python爬虫|Python爬虫入门(四):储存

https://zhuanlan.zhihu.com/p/21452812

(简介:本爬虫系列入门教程假设读者仅有一点点Python基础或者近乎为零的基础。如果是有Python基础的可以跳过一些对于Python基本知识的补充。)

教程资源:

书籍:

1.一份Python爬虫电子书 (路人甲)

https://zhuanlan.zhihu.com/p/28865834

(简介:这本书主要内容是Python入门,以及Python爬虫入门和Python爬虫进阶)

2.问题:求大神们推荐Python入门书籍

https://www.zhihu.com/question/38801925/answer/184406876

(简介:Python爬虫方面入门书籍推荐)

教程:

系列教程:

1.Python爬虫学习系列教程

https://zhuanlan.zhihu.com/p/25949099

(简介:学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫)

2.Python爬虫教程(一)使用request+Beautifi

https://zhuanlan.zhihu.com/p/35493091

Python爬虫教程(二)使用request+正则re批量下载好听轻音乐网歌曲https://zhuanlan.zhihu.com/p/35528714

3.python爬虫初探(一):爬虫的基本结构

https://zhuanlan.zhihu.com/p/32652572

python爬虫初探(二):URL管理器和下载器

https://zhuanlan.zhihu.com/p/32673371

python爬虫初探(三):HTML解析器

https://zhuanlan.zhihu.com/p/32675668

python爬虫初探(四):数据存储器

https://zhuanlan.zhihu.com/p/32697330

拓展教程:

1.爬虫万金油,一鹅在手,抓遍全球:goose 简介https://zhuanlan.zhihu.com/p/46595420

2.这个男人让你的爬虫开发效率提升8倍

https://zhuanlan.zhihu.com/p/38466193

3.Python 抓取网页乱码原因分析

https://zhuanlan.zhihu.com/p/21057822

4.干了这碗“美丽汤”,网页解析倍儿爽

https://zhuanlan.zhihu.com/p/58445021

进阶拓展:

进阶:

1.Python爬虫进阶

https://www.zhihu.com/question/35461941/answer/192693594

https://www.zhihu.com/question/35461941/answer/72909421

(简介:爬虫无非分为这几块:分析目标、下载页面、解析页面、存储内容)

2.“百行代码”实现简单的Python分布式爬虫

https://zhuanlan.zhihu.com/p/26045460

(简介:进阶知识)

拓展:

1.利用爬虫技术能做到哪些很酷很有用的事情?

https://www.zhihu.com/question/27621722

2.Python爬虫学到什么样就可以找工作了https://www.zhihu.com/question/61103114/answer/183926752

3.从python爬虫,到更爱这个世界

https://zhuanlan.zhihu.com/p/32711505

4.Python爬虫和情感分析简介

https://zhuanlan.zhihu.com/p/20359324

5.你是如何开始能写Python爬虫?

https://www.zhihu.com/question/21358581/answer/274132025

爬虫资源:

1.一个很“水”的Python爬虫入门代码文件

https://zhuanlan.zhihu.com/p/22982208

2.156个Python网络爬虫资源!

https://zhuanlan.zhihu.com/p/28407245

3.可能是最全面的75个Python爬虫资源

https://zhuanlan.zhihu.com/p/27985429

学习经验:

1.用Python写爬虫时应该注意的坑?

https://www.zhihu.com/question/49296232/answer/368313956

2.Python3网络爬虫学习建议?

https://www.zhihu.com/question/41277528/answer/95885043

3.Python爬虫知识点梳理

https://zhuanlan.zhihu.com/p/29523349

4.常用的 Python 爬虫技巧

https://zhuanlan.zhihu.com/p/23088379

5.如何优化Python爬虫的速度?

https://www.zhihu.com/question/20145091/answer/618321662

6.Python爬虫—破解JS加密的Cookie

https://zhuanlan.zhihu.com/p/25957793

7.主流网站 Python 爬虫模拟登陆方法汇总

https://zhuanlan.zhihu.com/p/59733826

8.三步走,教你定制自己的个性Python爬虫

https://zhuanlan.zhihu.com/p/23178014

9.Python爬虫传送post请求要携带哪些参数?https://www.zhihu.com/question/60256922/answer/174211193

框架工具:

框架:

1.Python有哪些常见的、好用的爬虫框架?

https://www.zhihu.com/question/60280580/answer/617068010

2.一个极为简洁的Python爬虫框架

https://zhuanlan.zhihu.com/p/23017812

3.拥有属于自己的Python爬虫框架--练习编写多线程、协程爬虫框架https://zhuanlan.zhihu.com/p/24469566

工具:

1.10个爬虫工程师必备的工具了解一哈

https://zhuanlan.zhihu.com/p/54855072

(简介:工欲善其事必先利其器的道理相信大家都懂。)

2.推荐4个爬虫抓包神器

https://zhuanlan.zhihu.com/p/61980749

(简介:今天推荐4个HTTP代理工具通过抓包分析,帮助你还原APP背后的每个请求。)

3.爬虫必备工具,掌握它就解决了一半的问题

https://zhuanlan.zhihu.com/p/39340856

(简介:今天这篇文章不谈任何具体网站的抓取,只来说一个共性的东西:如何通过 Chrome 开发者工具寻找一个网站上特定数据的抓取方式。)

4.听说你好不容易写了个爬虫,结果没抓几个就被封了?

https://zhuanlan.zhihu.com/p/28726244

(简介:实现一个自动获取可用代理 IP 的接口。)

爬虫实例:

1.利用python爬取网易云音乐,并把数据存入mysqlhttps://zhuanlan.zhihu.com/p/34354440

2.python爬取20w表情包之后,从此你就成为了微信斗图届的高手https://zhuanlan.zhihu.com/p/66243518

3.如何让Python爬虫一天抓取100万张网页

https://zhuanlan.zhihu.com/p/65508954

4.Python爬虫告诉你上海房价有多高

https://zhuanlan.zhihu.com/p/40293278

5.Python爬虫入门 | 2 爬取豆瓣电影信息

https://zhuanlan.zhihu.com/p/32037625

6.Python爬虫一步步抓取房产信息

https://zhuanlan.zhihu.com/p/25713752

7.我用Python又爬虫了拉钩招聘,给你们看看2019市场行情https://zhuanlan.zhihu.com/p/65081383

8.爬虫爬了下知乎上的神回复,已笑趴~

https://zhuanlan.zhihu.com/p/46132179

9.一键下载:将知乎专栏导出成电子书

https://zhuanlan.zhihu.com/p/44918640

10.如何用Python抓抖音上的小姐姐

https://zhuanlan.zhihu.com/p/46396868

11.【招聘数据分析】Python就业前景如何

https://zhuanlan.zhihu.com/p/35027220

专栏索引:

Python爬虫索引:

1.如何入门爬虫(路人甲)

https://zhuanlan.zhihu.com/p/21479334

(简介:一个知乎大神整理的关于Python爬虫的索引,内容详细全面,结构完整。对于新手和正在学习的小伙伴是非常有帮助的。)

2.从零开始写Python爬虫(Ehco)

https://zhuanlan.zhihu.com/p/26673214

(简介:提供了实用的方法和建议)

3.自学入门 Python 优质中文资源索引

https://zhuanlan.zhihu.com/p/49798116

(简介:自学入门Python的整理,有关于Python爬虫的索引)

Python爬虫号推荐:

1.蚍蜉撼大树

https://www.zhihu.com/people/handashu/posts/posts_by_votes

(简介:Python爬虫之旅系列)

2.州的先生

https://www.zhihu.com/people/zmister/posts/posts_by_votes?page=2

(简介:python爬虫实战入门系列)

3.学习python的正确姿势

https://www.zhihu.com/people/xue-xi-pythonde-zheng-que-zi-shi-92/posts/posts_by_votes

(简介:Python爬虫实战系列)

4.不吃夹生饭

https://www.zhihu.com/people/bu-chi-jia-sheng-fan/posts

(简介:反反爬虫系列)

爬虫项目索引:

1.资源整理|32个Python爬虫项目让你一次吃到撑

https://zhuanlan.zhihu.com/p/27938007

(简介:32个爬虫项目)

2.GitHub上有哪些优秀的Python爬虫项目?

https://www.zhihu.com/question/58151047/answer/640461600

(简介:GitHub上优秀的Python爬虫项目)

3.23个Python爬虫开源项目代码,包含微信淘宝,豆瓣知乎,微博等

https://zhuanlan.zhihu.com/p/58851666

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python是一种非常流行的编程语言,具有简单易学和强大的特点,因此被广泛应用于网络爬虫的开发中。而“关键字爬虫”是指利用爬虫技术从互联网上获取与指定关键字相关的信息。知乎是一个知识分享社区,其中包含了大量的问题和回答,因此可以作为爬取信息的目标网站。 利用Python爬虫库,我们可以编写爬虫程序来获取知乎上与指定关键字相关的问题和回答。首先,我们需要使用Python中的requests库来发送HTTP请求,获取知乎的网页源代码。接着,可以使用Beautiful Soup等库对网页进行解析,提取出其中的问题和回答内容。另外,也可以使用正则表达式等方法对文本进行匹配和提取。 关键字爬虫知乎上可以有很多应用场景,比如用于市场调研分析、舆情监测、热点事件追踪等。通过Python编写的爬虫程序,我们可以定期获取知乎上与关键字相关的最新信息,从而及时了解社会热点和舆论动向。 需要注意的是,在进行爬虫时,我们需要遵守知乎网站的相关规定和法律法规,不得对网站造成过大的访问压力,也不得违反知识产权、个人隐私等方面的法律规定。同时,在爬取数据时,也要注意数据的处理和使用是否符合法律和道德规范。因此,在进行关键字爬虫时,需要对爬取的数据进行合理的处理和分析,确保遵守相关法律法规。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值