网络爬虫
文章平均质量分 89
牟泉禹[Dark Cat]
这个作者很懒,什么都没留下…
展开
-
Python3 03 网络爬虫 <下载漫画>
@ 我的老师:Jack CuiPS:我是通过 看 Jack Cui 老师的文章 学习的爬虫,也为我之后的 爬虫打开了大门。3.1 下载漫画那么这一节,我们就要 去网络上下载漫画。即 图片 的爬取。经过了 上次 爬取文字,其实图片的爬取我们也能手到擒来。但是这一章,我们 需要学习的一个新知识点是:解决 header 头协议 反爬虫机制。 即最简单的反爬机制3.1.1 目标 URL我们都知道 大厂的 漫画,我们是 没法那么直接的爬取的。毕竟 人家 肯定有 安全保护。我们如果能把 这个保护 ..原创 2022-01-07 13:02:11 · 737 阅读 · 1 评论 -
Python 正则表达式 02 <可能是最后一章 Py正则>
2.1 re 模块去解决 一些样例问题2.1.1 实战 1.txtabcdefghijklmnopqurtuvwxyzABCDEFGHIJKLMNOPQRSTUVXYZ1234567890Ha HaHaaaacatmatpatbatMetaCharacters (Need to be escaped):.[{()^$|?*+coreyms.com321-555-4321123.555.12341235561234Mr.SchaferMr SmithMs DavisM原创 2022-01-07 10:14:36 · 429 阅读 · 0 评论 -
Python 正则表达式 01
Python 正则Python 的正则表达式 要 配合 re 模块 来进行使用。那么 在看完 我的这篇 通用正则 文章 后,我们先来 接触一下 在 Python 中 正则表达式 是如何 使用的。我们也将 通用正则里 的 三个 学习材料,当作 这篇文章的 学习材料!进行 实践和 学习。① match(正则表达式,待匹配的字符串,匹配的其它限制) 傻傻的 match 方法match() 方法 就是 只能从 起始位置开始 进行一个匹配。如果 匹配不上,那么就 玩完了。肯定会返回给你一个 None举例原创 2022-01-06 22:07:58 · 489 阅读 · 0 评论 -
Python3 网络爬虫 <教程全集>
1.1 最简单的爬虫@ 我的老师:Jack CuiPS:我是通过 看 Jack Cui 老师的文章 学习的爬虫,也为我之后的 爬虫打开了大门。1.1.1 URL 是什么?在学习 爬虫之前,我们必须知道 我们 平常 所说的网址,实际上 叫做 URL。即:统一资源定位符(Uniform Resource Locator)它的格式通常都是:协议://主机名[:端口]/资源路径/参数但是我们知道的是,一般我们看到的网址,好像都不是这么全。好像是 隐藏了 什么似的。对!没错,就是隐藏了点儿 东西。原创 2022-01-03 10:12:47 · 3778 阅读 · 8 评论