第二单元 认识数据
-
下列对学生相关属性描述中,不是标称属性的是( )。
A.学号
B.婚姻状况
C.身高
D.头发颜色 -
下列哪些选项能表示序数属性的数据集中趋势度量( )。
A.四分位数
B.众数
C.均值
D.标准差 -
( )可以观察从一个分布到另一分布是否有漂移。
A.盒图
B.分位数-分位数图
C.散点图
D.直方图 -
度量作为一种测度,满足以下哪些条件:
A.以上均是
B.同一性
C.三角不等式
D.对称性 -
Python科学计算的基本包是( )。
A.Pandas
B.Numpy
C.Scikit-learn
D.Matplotlib -
以下Python包中,提供了DataFrame数据类型的是( )。
A.Numpy
B.Pandas
C.Scikit-learn
D.Matplotlib -
为了避免包的依赖关系和系统兼容性等方面出现问题,本课程推荐的Python安装方式为( )。
A.直接下载Python安装
B.通过浏览器查找处理过的Python安装包
C.通过Anaconda安装
D.直接安装Pycharm -
下列对学生的描述属性中,标称属性的属性是:
A.学号
B.婚姻状况
C.身高
D.头发颜色 -
下列哪些指标可以度量数据的离散趋势度量:
A.极差
B.五数概括
C.四分位数极差
D.四分位数 -
在探索性数据分析中,认为最有代表性,最能反映数据重要特征的五数概括,包括:
A.中位数Q2
B.最大值
C.四分位数Q3
D.最小值 -
序数属性的值存在有意义的序。相邻两者之间的差是已知的。×
-
四分位数极差(IQR)是第1个和第2个四分位数之间的距离。×
-
在计算混合类型属性的相异性时,一般是通过将所有有意义的属性转换到共同的区间[0.0,1.0]上,实现在单个相异性矩阵中进行计算。√
-
给定两个数据对象(19,4,5)和(22,6,3),则两个对象之间的曼哈顿距离 7 。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】
-
给定两个数据对象(19,4,5)和(22,6,3),则两个对象之间的上确界距离 3 。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】