【加密社】3分钟快速制作一个爬虫？不懂编程也没关系

最新推荐文章于 2024-09-10 15:13:21 发布

加密社

最新推荐文章于 2024-09-10 15:13:21 发布

阅读量622

点赞数 20

分类专栏：福利资源闲侃区块链文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16712551/article/details/142085194

版权

区块链同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

15 篇文章 1 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

先上图，我们爬取的是某个区块链快讯的网站。

为什么我们要使用爬虫？

网络爬虫（又被称为网页蜘蛛，网络机器人）就是模拟浏览器发送网络请求，接收请求响应，一种按照一定的规则，自动地抓取互联网信息的程序。

原则上,只要是浏览器(客户端)能做的事情，爬虫都能够做。

像电商网站（比如亚马逊、淘宝）每天都会有大量的商品上新和用户评论。而在搜索引擎中，随便搜索一个热门关键词，比如“智能手机”，就能找到成千上万条相关的网页信息。

面对如此庞大的信息量，我们如何从中找到对我们有用的信息呢？

答案自然是筛选，那你作为用户，又没有权力直接进入人家数据库去筛选。那咋办呢？

那就需要用到我们的 “爬虫” 了

尽管网络爬虫这个名字听起来有点怪异，让人联想到那些软软蠕动的小生物，但它实际上是一个在网络世界中非常强大的工具。

网络爬虫可以帮助我们在海量的信息中快速找到我们需要的内容，为我们提供决策支持和有用的数据。

如何快速制作一个爬虫（Python）

1.安装环境

首先第一步，那肯定是要先安装python环境了，类似的教程网上有很多，在这里我就不介绍了。

2.安装依赖库

pip install beautifulsoup4

比如我的文件夹在,这个路径下，那么我在这个路径下运行cmd,输入上面的命令

一旦安装完成，你就可以开始使用 BeautifulSoup 来解析 HTML 文档了。

3.选择要爬取的网站，并提取HTML

我在这举个例子，大家就能看懂了。

爬取某区块链资讯网站

在网页上按F12进入开发者调试模式

利用HTML选择器，找到这块的HTML

那在这里可以看到，article标签就是我们要找的这一类的HTML

如果要优化的话，可以更深层次的往下去找，

例如这个div，每个article标签下都存在于这样的DIV，那么事情就简单了

鼠标放在刚才的div上，右键，编辑为html

把里面的东西全复制出来，类似于这样的结构

原封不动的，去找AI，我是这样问的

于是乎，AI就生成了一个爬虫的原型，对于不同的网站来说，HTML结构不同，但是AI也能处理的非常好。

如果它生成的脚本不对，你还可以把python内报错的信息发给他，他会重新给你生成一遍，一般来说，3次左右，就能生成一个完整无缺的，针对于你指定网站，指定内容的网站脚本。

关注

20
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
【加密社】3分钟快速制作一个爬虫？不懂编程也没关系

先上图，我们爬取的是某个区块链快讯的网站。网络爬虫（又被称为网页蜘蛛，网络机器人）就是模拟浏览器发送网络请求，接收请求响应，一种按照一定的规则，自动地抓取互联网信息的程序。原则上,只要是浏览器(客户端)能做的事情，爬虫都能够做。像电商网站（比如亚马逊、淘宝）每天都会有大量的商品上新和用户评论。而在搜索引擎中，随便搜索一个热门关键词，比如“智能手机”，就能找到成千上万条相关的网页信息。面对如此庞大的信息量，我们如何从中找到对我们有用的信息呢？答案自然是筛选，那就需要用到我们的 “爬虫” 了。
复制链接

扫一扫

专栏目录

加密社 CSDN认证博客专家 CSDN认证企业博客

码龄10年

38: 原创

298: 周排名

2万+: 总排名

5万+: 访问

: 等级

1522: 积分

868: 粉丝

1053: 获赞

29: 评论

757: 收藏

私信

关注

分类专栏

闲侃 6篇
福利资源 15篇
区块链 19篇
行情趋势 6篇
Nethereum教程 10篇
AI 3篇

最新评论

以太坊预言机Chainlink详解及价格预测
码农小筑: Chainlink确实解决了区块链信息孤岛的关键问题，LINK代币的角色也很核心。历史价格波动反映出加密市场的特性，未来预测需谨慎对待，分散投资是明智选择。
【加密社】马后炮视角来看以太坊二层战略
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619290952。
解密《黑神话：悟空》脚本
楽逸——: 俺看不懂，但俺大受震撼
解密《黑神话：悟空》脚本
妙为: 哈哈，我也不是游戏行业，可最近一直在用unreal engine5
解密《黑神话：悟空》脚本
HeChengQAQ: 看不懂，但感觉很nb

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

加密社 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。