环境参数:
linux:CentOS(6.4)
Hadoop:CDH(5.7)
开发工具:idea
大数据定义:
4v特征 : volume(量,即数据量大小) variety(类,即多样性)
velocity(速,即输入输出速度) value(真实性)
大数据解决问题:在快速的数据流转(velocity),多样的数据结构(variety),海量的数据规模(volume)中发现数据的价值(value)
大数据涉及的技术: 数据采集,数据存储,数据处理/分析/挖掘,可视化展示