数据图形化/假设检验
一、数据图形化
根本:正确的比较
散点图:探索性数据分析的奇妙工具
分析师利用散点图发现因果关系,就是两个事物之间的函数关系。我们最终的目的就是探索出,自变量影响因变量的原因。
2.多元图形
-
定义:一个图形能对三种以上的变量进行比较,这张图形就是多元图形。
-
优点:有效的比较是数据分析的基础,于是尽量让图图形多元化最有可能促成最有效的比较。
-
做法:同时展示多张图片,体现更多变量
绘图软件:python基于numpy,pandas,matlibplot等数据库制作
简单的比较:excel表格就能完成简单的计算以及列表
二、假设检验
致命:数据分析师千万不要等着公开数据后的答案。
数据分析师的理想是,找到问题的非直觉答案
现实中的各种原因呈现的是一种网络关系,而非是简单的线性关系
-
做出各种的分析假设
-
用手头的资料进行假设检验
假设检验的核心是伪证,也是假设检验的基础有效防止掉落进认知陷阱
诊断性:诊断性是证据所具有的一种功能,能够帮助我们评估所考虑的假设的
相对似然,如果证据具有诊断性,就能帮助我们对假设排序
提出非诊断性证据
我们无法剔除每一条假设,但是可以确定哪一条假设最强