遇到不会的步骤请看清风附件的excel表格。
一.饼图
最适合采用饼图的情形:
- 只有一个数据系列(单分类数据)。
- 任何数据值都必须大于零。
- 类别不超过七个。太多扇区会使图表难以阅读。
- 划分的类别最好是完整的,一般不完整时可以加其他。比如:手机品牌销量。
- 类别过多可用复合饼图时,千万别硬要画一个完整饼图。
- 类别只有两个就不用画图了,没多大必要。
注意:不用在图中加入标题,我们一般在论文的正文中加入(表上图下)。
另外,画出来的图一定要有分析,要告诉读者你画图的目的是什么。
二.柱状(形)图
柱状图常常用于展示多个分类(单个分类也可以)的数据变化和同类别各变量之间的比较情况。堆积柱状图可用于比较同类别各变量和不同类别变量总和差异;百分比堆积柱状图适合展示同类别的每个变量的比例。
-
切换行和列后的柱状图(左→右):
右键点击图-选择数据-切换行/列
-
条形图(横过来的柱状图):类别数过多时,使用条形图比较合适,柱状图的数看起来有点拥挤。
记得先排序再作图 -
双向条形图:
先作一条辅助列,再作图。如:
先把女性的数值取负,放到新的一列,然后将这列和男性数值一起作图。
选择柱状体,再调格式即可。 -
柱状图可以用来可视化回归结果:
注意:要先处理后再做图,作图时选择堆积柱状图,否则做出来的图会不好看。作完图后调格式即可。对图形的解读:
(1)用红色和黑色区分了显著和不显著的系数估计。红色是指系数估计跟0有显著差异,而黑色是指没有。因此解读的时候,关注红色柱子即可。
(2)柱子朝上,说明自变量和因变量的关系是正向的。自变量取值增加的时候,因变量取值也增加。类似地,如果柱子朝下,说明自变量和因变量的关系是负向的。自变量取值越大,因变量取值则越小。
(3)若对自变量进行了标准化,那么柱子的高度,也就是系数的估计值有可比性,可以直观地区分出自变量对因变量的影响大小。
三、直方图
很多人区分不开直方图和柱状图,事实上:直方图是显示数据频数或频率的柱状图。
1.频数直方图:
作图时只需要选中一列数据,不需要姓名的那列数据。
点横坐标,可以调箱的宽度、数目。一般找一个整数,不让范围出现小数。
2.频率直方图:作图较麻烦
利用数据分析-直方图 来作图。输入区域:体重,接收区域:分点。(包含列头的名称,并勾选标志)
- 直方图和柱状图的区别:
1.直方图展示数据的分布,柱状图比较数据的大小。
2.直方图X轴为定量数据,柱状图X轴为分类数据。
3.直方图y轴要么为数据的频数,要么为数据的频率,柱状图y轴为数据实际大小。 - 直方图的多种模式:
四、折线图
如果数据是时间序列数据(如日、月、季度或年度数据),则应该考虑使用折线图,尤其是时间跨度长且存在多个时间序列时(折线图也经常被称为时间序列图,或简称为时序图)。
当然,时间序列期数较少时,也可以考虑使用柱状图。
一般使用折线图,很少用堆积折线图。
注意:Excel有时会把年份视为变化指标。解决方法:比如输入’1979,这时会自动转为文本且不出错,手动调为文本的话,还是会出错。注意这里的引号是英文状态下的’。
- 双坐标折线图:
两个数据的数值相差很大时,需要用到主次纵坐标轴。
次坐标轴的折线应该在上方。
- 柱形图顶端的折线图
需要叠加三次,一个是折线图不变,一个改为面积图,一个用来改横坐标。
具体作法需要时看清风附件即可。
五、散点图
散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变
量之间的相互影响程度,点的位置由变量的数值决定。
- 带有标识的散点图:
六、箱线图
用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。
计算过程:
1 计算上四分位数、中位数、下四分位数以及均值;
2 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range);
3 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数,在箱子内部中位数的位置绘制横线;
4 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers);
5 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的边缘;
6 极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍‐3倍四
分位数差之间的异常值,用空心点表示;
7 为箱线图添加名称,数轴等,并在图中用×标记出数据的均值位置。
- 箱线图作用:
配合定性变量画分组箱线图,作比较。如果只有一个定量变量,很少用一个箱线图去展示其分布,更多选择直方图。
箱线图更有效的使用方法是作比较。假设要比较男女生的身高,用什么工具最好?答案是箱线图。箱线图明显更加有效,能够从平均水平(中位数)、波动程度(箱子高度)以及异常值对男女教师的教学评估得分进行比较,而直方图却做不到。