什么是数据分析?
数据分析是将数学、统计学理论结合科学的统计分析方法,对数据库、excel、网页抓取的数据以及采集的大量数据等进行分析,从中提取有价值的信息形成理论并进行展示的过程。目的是将隐藏在一大堆看似杂乱无章的数据背后的有用信息提取出来,总结数据的内在规律,帮助在实际工作中的管理者做出决策和判断。
常用的数据分析方法
数据分析方法一般分为:描述性数据分析、探索性数据分析、验证性数据分析。
描述性分析是最基础、最初级的分析。
探索性分析侧重于发现数据的规律和特征。
验证性分析是已经确定使用哪种假设模型,通过验证性数据分析来对假设模型进行验证。
从技术层面分为三种:
1、统计类:包括对比分析、同比分析、环比分析、结构分析、因素分析、80/20法则等;
2、高级分析类:以建模理论为主,包括回归分析、聚类分析、相关分析、矩阵分析、判别分析、主成分分析、因子分析、对应分析、时间序列分析等;
3、数据挖掘类:以机器学习、数据仓库等复合技术为主。
数据分析的应用
应用于各个韩各样。在互联网行业,通过数据分析可以根据客户意向进行商品推荐以及有针对性的广告投放等。在医学方面,可以实现智能医疗、健康指数评估和DNA对比等。在网络安全方面,可以通过数据分析建立一个潜在攻击性的分析模型,监测大量的网络访问数据与访问行为,可以快速地识别出可疑网络的访问,起到有效防御作用。在交通方面,可以根据交通状况数据与GPS定位系统有效地预测交通实时路况信息。在通信方面,可以统计骚扰电话,进行骚扰电话的拦截与黑名单的设置等。在个人生活方面,可以对个人生活习惯进行分类,提供更加周到的个性化服务等。