数据分析与建模
1.什么是大数据?
大数据是一种强大到在获取、存储、管理、分许方面远超出传统数据库软件工具能力范围的数据集合。
2.大数据的4V特性
Volume(大量):海量的数据规模
Velocity(高速):快速的数据流转
Variety(多样):多样的数据类型
Value(价值):价值密度低
3.监督学习(Supervised Learning)
监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。
4.无监督学习(Unsupervised Learining)
无监督学习是指根据类别未知的训练样本解决模式识别中的各种问题的过程。
5.数据挖掘(Data Mining)
数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。