1.分析是指收集处理数据并获取数据隐含信息的过程。
2.类型:三个层次
① 描述性分析
② 预测性分析
③ 分析和规则性分析
3.数据分析方法:概述
来源
活动步骤
分析
4.大数据分析方法的三种体系:
① 面向数据视角
② 面向流程视角
③ 面向信息技术视角
5.必要的四大步骤
一.识别目标需求
二.采集数据
三.数据预处理
四.数据挖掘:创建数据挖掘模型的一组试探法和计算方法,贡过对提供的数据进行分析,查找特定的类型模式和趋势,最终形成创建模型。
6.技术:
统计分析
数据挖掘
机器学习
可视化分析
7.常用算法(数据挖掘):分类、聚类、回归分类、关联分析、特征分析、web网页挖掘、人工神经网络。
8.挖掘工具:hadoop mahout spark mllib storm apache drill rapidminer pentahoBI
9.关联规则是用于发现事物之间的相关联系。
10.算法:K-means svm apriori em pagerank addboost knn等等。
11.应用领域:医疗保险,金融,市场业,零售业,制造商,司法,工程与科学,保险业。