纯小白爬虫篇-以学促学

最新推荐文章于 2024-10-18 14:25:40 发布

YSJins

最新推荐文章于 2024-10-18 14:25:40 发布

阅读量261

点赞数

文章标签：爬虫 python pip pycharm html

本文链接：https://blog.csdn.net/Crazy_moilion/article/details/128077996

版权

前言：应当算是新人文档，“白嫖”了很久的 CSDN 各位大佬，决定给后来的人留点什么，也给自己留下些什么

前言

提示：这里是本文要记录的大概内容：

学习这项技术的 “初衷” 是为了满足一些个人需求，很多优美的文章，很多优质的视频，很多有用的帖子，因为各种不可抗拒因素，时常会被下架，删除，或者作者想退坑等等，因此决定对自己进行定制学习。

提示：以下是本篇文章正文内容

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 - - - - - 来自百度百科

在线正则表达式测试：

符号	用法
*	重复零次或更多次 - - 开始和结束算一次，算在匹配的最后面 - - 侧重更多次(结果)
+	重复一次或更多次 - - 侧重更多次(结果)
？	重复零次或一次 - - 侧重一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n次到m次