##大数据技术概览
一、什么是大数据
定义:大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高速增长率和多样化的信息资产。
特点:大量、告诉、多样、低价值密度、真实性。
数据计量单位:byte、bit、k、M、G、T、P 之间都是1024
传统数据与大数据区别:
**大数据:**超出传统数据库工具手机、存储、管理和分析能力的数据集
4v特征 大量、高速、多样、价值密度低
二、应用场景
基于大数据的数据仓库
构建数据仓库主要用来进行数据分析
传统数据仓库主要单机存储
大数据分布式的存储,分布式计算
基于大数据实时流处理
车流量信息
三、如何学习大数据
1、硬件
操作系统:win7
系统类型:64位
内存:8G
操作系统:win10
系统类型:64位
内存:8G
检测个人电脑支持的最大内存
win+r
打开cmd
wmic memphysical get maxcapacity
2、软件
Google浏览器
火狐浏览器
IDM下载安装配置
MarkDown马克飞象
JDk安装
Notepad++
Vmware Work station 虚拟化桌面
linux
Xshell
IDEA