爬虫基础学习-01

本文介绍了大数据的4个V——volume、variety、velocity和value,阐述了爬虫在处理大量、不同类型、快速处理和价值密度低的数据中的重要角色,强调了爬虫在大数据时代的价值。
摘要由CSDN通过智能技术生成

认识爬虫

4个v

第一个V就是volume,是大量的。大数据的量很大,某一个程度上达到PB级才是大数据,但是有时候几百T也是大数据。

第二个V(variety)是类型,现在随着互联网的发展,很多类型不再是我们传统意义上处理的结构化数据,有时候是半结构化,甚至是非结构化,原有的信息技术很难处理的技术。

第三个V(velocity)是速度,就是大数据的处理速度要很快,在很快、很及时的时间内,从大量的数据中来非常及时的获得到我想要的数据和信息。比如说这个数据半个月以后分析出来好了,但是对我已经没有用了,时间已经过去了。在公共安全的领域甚至治安的领域,利用数据分析是很现实的一个应用。

第四个是value,大家知道,实际上value表示的是价值密度低,它是一个“废品利用”、“沙里淘金”、“大海捞鱼”的过程。从国家发改委牵头从一两年之前开始研究,会同工信部等部门来做相关行动纲要的研究和起草。从国家信息化发展大的角度来说,行动纲要的大数据的角度来看,我们学习大数据有一个共识,这样才对它的战略、内容会有更好的理解。

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

哈都婆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值