按理来说学统计离不开数据,数据分析离不开EDA,而EDA又离不开画图,毕竟图是最直观揭露变量关系和变量的问题的。一句话,解释完毕。那不成,我得好好整理一下学过的这些图:
- scatter plot 散点图
适用:两个变量的关系 (刚开始学的时候为了复习考试就死记硬背是看线性关系,其实还可以看很多啊,比如聚类就可以看啊)
条件: 两个数字型变量 (two numerical)(其实三个也可以,只不过不好看,啊,不是不好看,是不方便看。。。; 其实文字型的也可以,也是因为太长了不好看,不方便看,比如那个PCA的biplot 用文字label,直接好家伙,密密麻麻的根本不知道谁是谁,这种就很没意义。就是因为不方便看,才需要上颜色,这一点R的强大画图功能就体现出来了,一个color= "variable name" 就搞定了)
2. bar blot 条形图
这个就很常见啊,小学数学就涉及了呢。记得那时候还拿个尺子倍儿认真的搁那儿比划。。。
适用:不同分类下的计数。