大数据带来的技术变革
技术驱动:数据量大
存储:文件存储 ==> 分布式存储
计算:单机 ==> 分布式计算
网络:万兆
DB: RDBMS ==> NoSQL(HBase/Redis....)
大数据技术概念
单机:CPU Memory Disk
分布式并行计算/处理
船的选择
廉价:
中高价值:
运输过程拆开
货物搬到船上: 数据采集 数据存储
处理:小于多少的石头扔了 精细化的筛选
数据采集:Flume Sqoop
数据存储:Hadoop
数据处理、分析、挖掘:Hadoop、Spark、Flink....
可视化: