根据数据等级选择图形进行数据可视化及计算操作(附python代码)

数据类型:根据数据等级选择图形进行数据可视化及计算操作

进行数据探索性分析时需要使用图形进行数据的可视化处理,而数据可视化常用的图形包括:条形图(柱状图)、饼图、散点图、折线图、茎叶图、直方图、箱型图等。在数据分析时要面对怎样选择合适的图形进行原始数据的可视化问题。其中一个方法是根据数据的类型或等级来选择可视化图形。
数据类型图:在这里插入图片描述
大多数的数据集,都会同时存在定性数据和定量数据。

定性数据vs.定量数据

  1. 定性数据:一般是用于描述事物的性质,规定类别的表述型数据。如服务评价:非常满意、满意、不满意。
  2. 定量数据:一般是用于衡量事物的数量,以数值形式存在并可以进行测量的数据。如:速度、距离、时间等。
    某些情况下,定性数据和定量数据之间会存在一些模糊性,如服务评分(1~5),虽然是数字,但是也可以代表类别(如:等级1-5 )。如果计算平均评分得到4.21,那这个数据就是定量的。

数据的等级:

1. 定类等级 – 数据的最低层级,规定了事物的某种特殊属性。数据按照类别属性进行分类,各类别之间是平等并列关系,所以在各类别之间不能进行排序,例如:颜色,性别、血型等。

定类数据执行的主要数值运算是计算每一类别中的项目频数或频率,一般使用计数的方法进行统计(如:众数),可使用饼图,条形图做数据展示。
示例代码:
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

2. 定序等级 – 这种数据仍是类别数据,但不仅可以被分成不同的类别,并且各个类别之间存在高低差异,能通过排序进行优劣比较,如:学历,评定(优、中、差)等。

定序数据不但能使用计数方法,还能进行比较和排序,因此可以使用饼图、条形图,茎叶图和箱型图等来展示。
在这里插入图片描述在这里插入图片描述在这里插入图片描述

3. 定距等级 – 是具有一定单位的实际测量值,属于数值型数据。

定距数据可以对事物类别或次序之间的实际距离进行测量,即两个变量值之间的差异是有意义的,所以不但能对数据值进行排序和比较,也可以进行加减法的计算。如:摄氏温度、身高,年龄等。可以使用茎叶图和箱型图,甚至有时也可使用直方图来展示。
在这里插入图片描述在这里插入图片描述在这里插入图片描述

4. 定比等级 – 数据的最高等级,是实际的测量值,具有绝对零值的概念。

定比数据和定距数据一样是定量数据类型,但由于它是存在绝对零点的,所以不但可以使用加减法,也可以使用乘除法来进行运算。一般使用茎叶图、箱型图和直方图来展示。
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
参考资料:《Feature Engineering Made Easy》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值