数据科学-数据的图表展示

本文详细介绍了数据的图表展示,涵盖数据预处理(数据审核、筛选、排序)、品质数据(分类数据和顺序数据)的整理与图示、数值型数据的整理与展示,以及如何合理使用图表。重点讨论了数据分组、直方图、茎叶图、箱线图、线图等图形的使用,并提出了鉴别图形优劣的准则。
摘要由CSDN通过智能技术生成

数据的图表展示

1数据预处理

1.1数据审核

原始数据:完整性,准确性
完整性:调查的单位或个体是否有遗漏,所有的调查项目是否填写齐全
准确性:检查数据是否有错误,是否存在异常值
异常值处理:如果属于记录时的错误,在分析之前应给予纠正,若异常值是一个正确的值,给予保留

二手数据:适用性,时效性
适用性:应弄清楚数据的来源,数据的口径以及有关的背景资料
时效性:对于时效性较强的问题,如果数据过于滞后,则没有研究意义

1.2数据筛选

找出符合特定条件的某类数据

1.3数据排序

按一定的属性将数据排列,以便研究者通过浏览数据发现一些明显的特征和趋势,找到解决问题的线索,还有助于对数据进行检查纠错,为重新归类或分组等提供方便

2品质数据的整理与展示

2.1分类数据的整理与图示

分类数据本身就是对事物的一种分类,因此在整理时实现列出所分的类别,然后计算出每一类别的频数,频率,或比例,比率等,形成一种频数分布表,最后根据需要选择适当的图形进行展示。

频数与频数分布
频数:落在某一特定类别或组中的数据格式
频数分布:把各个类别落在其中的相应频数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值