一,流程
二,数据分析概述
含义与目标:使用统计分析方法,在数据中提取有用的信息并进行总结与概括的过程。
三,使用工具
蟒蛇语言以及numpy的,SciPy的,matplotlib,scikit学习,熊猫等工具包
注意:学习过程中要勤于查阅
A、数据获取手段
1.数据仓库(DW):将所有业务数据经汇总处理构成
1)特点:
全部事实的记录;部分维度与数据的整理
2)数据库与数据仓库的不同
++数据库面向业务存储,仓库面向主题存储(主题:对于购买图书这一行为就可看作是个主题。谁在几分几秒以什么价格购买了什么书就是购买主题的一个记录。)
++数据库针对应用(OLTP),仓库针对分析(OLAP)
++数据库组织规范,仓库可能冗余,相对变化大,数据量大
2.监测与抓取
监测:使用检测设备或算法直接获