
Python爬虫
文章平均质量分 95
在当今数字化信息爆炸的时代,数据已然成为一座蕴藏无尽价值的宝藏。本 “Python 爬虫” 专栏,将带你深入探秘数据抓取的奇妙世界。无论你是初涉编程的新手小白,渴望开启挖掘网络数据的大门;还是已有一定基础,意图精进爬虫技术,提升数据获取效率,这里都有你所需。我们会从 Python 爬虫的基础原理讲起
ningmengjing_
这个作者很懒,什么都没留下…
展开
-
五、并发爬虫
并发爬虫实例原创 2025-03-05 01:35:44 · 2299 阅读 · 0 评论 -
多任务——线程
每个线程默认有一个名字,尽管上面的例子中没有指定线程对象的name,但是python会自动为线程指定一个名字。当线程的run()方法结束时该线程完成。无法控制线程调度程序,但可以通过别的方式来影响线程调度的方式。确保了某段关键代码只能由一个线程从头到尾完整地执行阻止了多线程并发执行,包含锁的某段代码实际上只能以单线程模式执行,效率就大大地下降了由于可以存在多个锁,不同的线程有不同的锁,并试图获取对方持有的锁时,可能会造成死锁。Python的QueueFIFOQueueLIFO。原创 2025-03-06 15:11:44 · 1070 阅读 · 0 评论 -
四、数据存储
爬虫的数据存储方法,以及一些案例原创 2025-03-03 01:55:35 · 749 阅读 · 0 评论 -
三、数据提取
爬虫的几种数据提取方式原创 2025-03-02 09:43:46 · 918 阅读 · 0 评论 -
二、requests模块的使用
作用:发送网络请求,返回响应数据。对于爬虫任务,使用 requests 模块基本能够解决绝大部分的数据抓取的任务。所以用好 requests 至关重要。原创 2025-02-25 00:59:00 · 1635 阅读 · 0 评论 -
一、初始爬虫
网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地爬取互联网信息的程序。原则上,只要是浏览器(客户端)能做的事情,爬虫都能够做。1.2 如何获取爬虫程序下载其他公司开发的通用爬虫(八爪鱼)开发人员自己编写。原创 2025-02-23 22:59:33 · 1514 阅读 · 0 评论