一、什么是大数据?
是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
是指一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
二、大数据特点
1.大量 :数据量巨大,从TB到PB级别
2.高速 :数据量在持续增加(两位数的年增长率)。
3.多样 :数据类型复杂,超过80%的数据是非结构化的。
4.低密度高价值 :低成本创造高价值
*大数据下服务器系统安装
在大数据背景下,服务器系统安装中,系统硬盘、数据硬盘完全隔离。数据硬盘必须独立挂载,每个硬盘挂载到系统的一个独立的目录下。
三、大数据为什么那么快?
传统数据 大数据
扩展性 纵向扩展 横向扩展
分布式 资源集中 资源分布
可用性 单份数据 数据复制
模 型 移动数据 移动计算程序
1、传统的时纵向扩展
服务器数量不发生变化,配置越来越高(发生变化)
大数据横向扩展
配置不发生变化,服务器数量越来越多(发生变化)
2 、传统的方式资源(cpu/内存/硬盘)集中 大数据方式资源(cpu/内存/硬盘)
分布(前提:同等配置的前提下)
3、传统数据备份方式单份备份
大数据数据备份方式多分备份(数据复制,默认三个副本)
4、传统的计算模型是移动数据到程序端
大数据计算模型是移动程序到数据端