初学.net core爬虫必看

非常简单的爬虫其实就是获取页面信息。获取他们然后把他们这些页面的信息持久化也好,还是处理也好,这样处理后方便日后调用或者当下的计算。那么为什么还要做这写事情呢?我们直接通过网页查看不好吗?

那么问题来了:有些人想一个人看10个网页的部分数据信息。但是他又不想一个一个去翻,那么就只能一个一个去看,在这个过程中,就需要获取这个页面的元素,把10个页面的部分信息都获取出来展示到一个界面上,这就是我们爬虫的一个用途,

下面上图介绍:

我用的是谷歌浏览器,所以 可以使用 shift + ctrl + i(I) 打开我们的“检查”

谷歌浏览器

我们选择元素栏:Elements

元素栏

看下图经过对比,我们发现了元素栏中有一串文字和我们的界面文字是很像的。那么就是这个东西,对我们有用。我们就是要通过技术的方式获取到这些信息,这样可以间接性的掠过了广告以及那些不需要看到的元素。

元素和文章对比

上面讲到的东西就是我们爬虫可以干的活,那么下面的文章就是介绍如果通过.net core 技术来实现这些东西。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

盗理者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值