数据分析概述
- 信息数量爆炸 大数据时代
数据来源
- 互联网(社交 搜索 电商) 移动互联网(微博) 物联网(传感器 智慧地球)
车联网 GPS 医学影像 安全监控 金融(银行 股市 保险) 电信(通信 短信)
作用
- 帮助企业和个人预测未来的趋势和行为,使得商务和生产生活具有前瞻性(淘宝推送)
什么是数据分析
- 数据分析就是使用适当的统计分析方法(如聚类分析、相关分析等)对收集来的大量数据进行分析,从中提取有用的信息和规律形成结论,并加以详细研究和概括总结的过程
- 数据分析的目的在于将隐藏在一大批看似杂乱无章的数据信息中的有用数据集提炼出来。以找出研究对象的内在规律。
在统计学领域中可以分为三大类:
- 描述性数据分析:从一组数据中可以摘要并且描述这份数据的集中和离散情形
- 探索性数据分析:从海量数据中找出规律,并产生分析模型和研究假设
- 验证性数据分析:验证科研假设测试所需的体哦阿健是否达到,以保证验证性分析的可靠性
常见分析方法
- 描述性分析隶属于初级分析常见分析方法有:对比分析法、平均分析法、交叉分析法
- 探索性和验证性隶属于高级数据分析常见方法有:相关分析、因子分析、回归方程等
数据分析的基本流程
- 明确目的和思路