第二单元 认识数据

第二单元 认识数据

  1. 下列对学生相关属性描述中,不是标称属性的是( )。
    A.学号
    B.婚姻状况
    C.身高
    D.头发颜色

  2. 下列哪些选项能表示序数属性的数据集中趋势度量( )。
    A.四分位数
    B.众数
    C.均值
    D.标准差

  3. ( )可以观察从一个分布到另一分布是否有漂移。
    A.盒图
    B.分位数-分位数图
    C.散点图
    D.直方图

  4. 度量作为一种测度,满足以下哪些条件:
    A.以上均是
    B.同一性
    C.三角不等式
    D.对称性

  5. Python科学计算的基本包是( )。
    A.Pandas
    B.Numpy
    C.Scikit-learn
    D.Matplotlib

  6. 以下Python包中,提供了DataFrame数据类型的是( )。
    A.Numpy
    B.Pandas
    C.Scikit-learn
    D.Matplotlib

  7. 为了避免包的依赖关系和系统兼容性等方面出现问题,本课程推荐的Python安装方式为( )。
    A.直接下载Python安装
    B.通过浏览器查找处理过的Python安装包
    C.通过Anaconda安装
    D.直接安装Pycharm

  8. 下列对学生的描述属性中,标称属性的属性是:
    A.学号
    B.婚姻状况

    C.身高
    D.头发颜色

  9. 下列哪些指标可以度量数据的离散趋势度量:
    A.极差
    B.五数概括
    C.四分位数极差
    D.四分位数

  10. 在探索性数据分析中,认为最有代表性,最能反映数据重要特征的五数概括,包括:
    A.中位数Q2
    B.最大值
    C.四分位数Q3
    D.最小值

  11. 序数属性的值存在有意义的序。相邻两者之间的差是已知的。×

  12. 四分位数极差(IQR)是第1个和第2个四分位数之间的距离。×

  13. 在计算混合类型属性的相异性时,一般是通过将所有有意义的属性转换到共同的区间[0.0,1.0]上,实现在单个相异性矩阵中进行计算。√

  14. 给定两个数据对象(19,4,5)和(22,6,3),则两个对象之间的曼哈顿距离 7 。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】

  15. 给定两个数据对象(19,4,5)和(22,6,3),则两个对象之间的上确界距离 3 。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值