第5章 使用pandas进行数据预处理 课后习题

本文提供了关于使用pandas进行数据预处理的课后习题及答案,涵盖了数据质量要素、数据清洗、数据合并、数据标准化、缺失值处理、异常值检测等方面,帮助理解pandas在数据分析预处理中的应用。
摘要由CSDN通过智能技术生成

1.选择题
(1)数据质量包含的要素有(D)
A.准确性、完整性
B.一致性、可解释性
C.时效性、可信性
D.以上所有要素
(2)以下关于数据分析预处理的过程描述正确的是©
A.数据清洗包括了数据标准化、数据合并和缺失值处理
B.数据合并按照合并轴方向主要分为左连接、右连接、内连接和外连接
C.数据分析的预处理过程主要包括数据清洗、数据合并、数据标准化和数据转换,他们之间存在交叉,没有严格的先后关系
D.数据标准化的主要对象是类别型的特征
(3)有一份数据,需要查看数据的类型,并将部分数据做强制类型转换,以及对数值型数据做基本的描述型分析。下列的步骤和方法正确的是(A)
A.dtypes查看类型,astype转换类别,describe描述性统计
B.astype查看类型,dtypes转换类别,describe描述性统计
C.describe查看类型,astype转换类别,dtypes描述性统计
D.dtypes查看类型,describe转换类别,astype描述性统计
(4)下列关于concat函数、append方法、merge函数和join方法的说法正确的是(D)
A.concat是最常用的主键合并的函数,能够实现内连接和外连接
B.append方法只能用来做纵向堆叠,适用于所有纵向堆叠
C.merge是常用的主键合并的函数,但不能够实现左连接和右连接
D.join是常用的主键合并方法之一,但不能够实现左连接和右连接
(5)以下关于drop_duplicates函数的说法中错误的是(B)
A.仅对DateFrame和Series类型的数据有效
B.仅支持单一特征的数据去重
C.数据重复时默认保留第一个数据
D.该函数不会改变原始

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值