数模笔记-Excel绘图-自用

遇到不会的步骤请看清风附件的excel表格。

一.饼图

最适合采用饼图的情形:

  1. 只有一个数据系列(单分类数据)。
  2. 任何数据值都必须大于零
  3. 类别不超过七个。太多扇区会使图表难以阅读。
  4. 划分的类别最好是完整的,一般不完整时可以加其他。比如:手机品牌销量。
  5. 类别过多可用复合饼图时,千万别硬要画一个完整饼图。
  6. 类别只有两个就不用画图了,没多大必要。

注意:不用在图中加入标题,我们一般在论文的正文中加入(表上图下)。
另外,画出来的图一定要有分析,要告诉读者你画图的目的是什么。

二.柱状(形)图

柱状图常常用于展示多个分类(单个分类也可以)的数据变化和同类别各变量之间的比较情况。堆积柱状图可用于比较同类别各变量和不同类别变量总和差异;百分比堆积柱状图适合展示同类别的每个变量的比例。

  • 切换行和列后的柱状图(左→右):

    右键点击图-选择数据-切换行/列
    在这里插入图片描述

  • 条形图(横过来的柱状图):类别数过多时,使用条形图比较合适,柱状图的数看起来有点拥挤。
    在这里插入图片描述
    在这里插入图片描述
    记得先排序再作图

  • 双向条形图:
    先作一条辅助列,再作图。如:
    在这里插入图片描述
    先把女性的数值取负,放到新的一列,然后将这列和男性数值一起作图。
    选择柱状体,再调格式即可。

  • 柱状图可以用来可视化回归结果:

    注意:要先处理后再做图,作图时选择堆积柱状图,否则做出来的图会不好看。作完图后调格式即可。

    对图形的解读
    (1)用红色和黑色区分了显著和不显著的系数估计。红色是指系数估计跟0有显著差异,而黑色是指没有。因此解读的时候,关注红色柱子即可。
    (2)柱子朝上,说明自变量和因变量的关系是正向的。自变量取值增加的时候,因变量取值也增加。类似地,如果柱子朝下,说明自变量和因变量的关系是负向的。自变量取值越大,因变量取值则越小。
    (3)若对自变量进行了标准化,那么柱子的高度,也就是系数的估计值有可比性,可以直观地区分出自变量对因变量的影响大小。

三、直方图

很多人区分不开直方图和柱状图,事实上:直方图是显示数据频数或频率的柱状图。
在这里插入图片描述
1.频数直方图:
作图时只需要选中一列数据,不需要姓名的那列数据。
点横坐标,可以调箱的宽度、数目。一般找一个整数,不让范围出现小数

2.频率直方图:作图较麻烦
利用数据分析-直方图 来作图。输入区域:体重,接收区域:分点。(包含列头的名称,并勾选标志)

  • 直方图和柱状图的区别:
    1.直方图展示数据的分布,柱状图比较数据的大小。
    2.直方图X轴为定量数据,柱状图X轴为分类数据。
    3.直方图y轴要么为数据的频数,要么为数据的频率,柱状图y轴为数据实际大小。
  • 直方图的多种模式:
    在这里插入图片描述

四、折线图

如果数据是时间序列数据(如日、月、季度或年度数据),则应该考虑使用折线图,尤其是时间跨度长且存在多个时间序列时(折线图也经常被称为时间序列图,或简称为时序图)。
当然,时间序列期数较少时,也可以考虑使用柱状图。
一般使用折线图,很少用堆积折线图。
注意:Excel有时会把年份视为变化指标。解决方法:比如输入’1979,这时会自动转为文本且不出错,手动调为文本的话,还是会出错。注意这里的引号是英文状态下的’

  • 双坐标折线图:
    两个数据的数值相差很大时,需要用到主次纵坐标轴。
    次坐标轴的折线应该在上方。
    在这里插入图片描述
  • 柱形图顶端的折线图
    在这里插入图片描述
    需要叠加三次,一个是折线图不变,一个改为面积图,一个用来改横坐标。
    具体作法需要时看清风附件即可。

五、散点图

散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变
量之间的相互影响程度,点的位置由变量的数值决定。
在这里插入图片描述

  • 带有标识的散点图:
    在这里插入图片描述

六、箱线图

用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。
在这里插入图片描述
计算过程:
1 计算上四分位数、中位数、下四分位数以及均值;
2 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range);
3 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数,在箱子内部中位数的位置绘制横线;
4 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers);
5 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的边缘;
6 极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍‐3倍四
分位数差之间的异常值,用空心点表示;
7 为箱线图添加名称,数轴等,并在图中用×标记出数据的均值位置。

  • 箱线图作用:
    配合定性变量画分组箱线图,作比较。如果只有一个定量变量,很少用一个箱线图去展示其分布,更多选择直方图。
    箱线图更有效的使用方法是作比较。假设要比较男女生的身高,用什么工具最好?答案是箱线图。箱线图明显更加有效,能够从平均水平(中位数)、波动程度(箱子高度)以及异常值对男女教师的教学评估得分进行比较,而直方图却做不到。
    在这里插入图片描述
  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值