【一】hadoop概述

最新推荐文章于 2024-09-18 15:56:51 发布

原创最新推荐文章于 2024-09-18 15:56:51 发布

· 178 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

Hadoop生态圈专栏收录该内容

11 篇文章

订阅专栏

##大数据技术概览

一、什么是大数据
定义：大数据（bigdata），指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高速增长率和多样化的信息资产。

特点：大量、告诉、多样、低价值密度、真实性。

数据计量单位：byte、bit、k、M、G、T、P 之间都是1024

传统数据与大数据区别：
在这里插入图片描述

**大数据：**超出传统数据库工具手机、存储、管理和分析能力的数据集

4v特征 大量、高速、多样、价值密度低

二、应用场景

基于大数据的数据仓库
构建数据仓库主要用来进行数据分析
传统数据仓库主要单机存储
大数据分布式的存储，分布式计算

基于大数据实时流处理
车流量信息

三、如何学习大数据

1、硬件
操作系统：win7
系统类型：64位
内存：8G
操作系统：win10
系统类型：64位
内存：8G
检测个人电脑支持的最大内存
win+r
打开cmd
wmic memphysical get maxcapacity

2、软件
Google浏览器
火狐浏览器
IDM下载安装配置
MarkDown马克飞象
JDk安装
Notepad++
Vmware Work station 虚拟化桌面
linux
Xshell
IDEA

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。