【20200326】数据挖掘课程课业打卡三


叮嘟!这里是小啊呜的学习课程资料整理。好记性不如烂笔头,今天也是努力进步的一天。一起加油进阶吧!
在这里插入图片描述

数据挖掘课业打卡三之数据质量

一、单选题

1、下列说法中错误的是:

A、噪声是测量误差的随机部分

B、数据中出现遗漏值的原因,可能是信息没有收集到,或者属性不适用于所有情况。

C、通常由于不同的数据源合并时造成重复数据的产生

D、离群点不可能是合法的数据对象或值

正确答案: D
关于离群点
在这里插入图片描述

2、下列选项中不属于数据预处理方法的是

A、维归约 
B、聚类 
C、离散化与二元化   
D、属性变换

正确答案: B
关于数据预处理方法
在这里插入图片描述
3、下列说法中错误的是:

A、维归约是通过创建新属性,将一些旧属性合并在一起来降低数据集的维度值
B、通过聚集操作,对象或属性群的行为通常比单个对象或属性的行为更加稳定;并且聚集操作不会丢失有趣的细节
C、之所以可以进行特征子集选择,是因为特征中通常包含冗余特征和不相关特征
D、特征创建方法包括:特征提取、映射数据到新的空间、特征构造

正确答案: B
关于聚集
在这里插入图片描述

二、填空题

向量x=[3,2,3,1],y=[1,4,5,3],两者之间的欧几里得距离为____。               

正确答案:4
解析:可以直接运用公式算得,也可自己编写函数算得;
在这里插入图片描述

三、判断题

1、通常,信用卡盗刷的交易记录在全体信用卡交易的事务数据中,可以视为是离群点。

正确答案:√

2、离群点可以是合法的数据对象或值。

正确答案:√

3、数据中出现遗漏值的原因,可能是信息没有收集到,或者属性不适用于所有情况。

正确答案:√

4、维归约和特征子集选择这两种操作都可以达到降低数据维度的效果。

正确答案:√

5、对变量进行标准化/规范化,就是创建一个新的变量,它具有均值0和标准差0。

正确答案:×
在这里插入图片描述

知识点汇总

1、数据中可能存在的问题

(1)噪声和伪像
在这里插入图片描述
(2)离群点
在这里插入图片描述
(3)遗漏值
在这里插入图片描述
(4)不一致的值
在这里插入图片描述
(5)重复的值
在这里插入图片描述

2、数据预处理方法

(1)聚集(Aggregation)
在这里插入图片描述
(2)抽样(Sampling)
抽样常用于数据的事先调查和最终的数据分析。

(3)维归约(Dimensionality Reduction)
通过创建新属性,将一些旧属性合并在一起来降低数据集的维
度。

(4)特征子集选择(Feature subset selection)
降低维度的另一种方法是仅仅使用特征的一个子集。
在这里插入图片描述
(5)特征构造(Feature creation)
常常可以由原来的属性创建新的属性集,更有效地捕获数据集中的重要信息。

(6)离散化与二元化(Discretization and Binarization)
在这里插入图片描述
(7)属性变换(Attribute Transformation)
属性变换是指用于变量的所有值的变换。对于每个对象,变换都作
用于该对象的变量值。
在这里插入图片描述

3、关于欧几里得距离

在这里插入图片描述
函数实现:

function dis = myEulidean(A,B) 
   [ax,ay]=size(A);
   [bx,by]=size(B);
   if (ax>1 && ay>1)||(bx>1 && by >1)
       error('输入中存在非向量');
   elseif (ax>ay) && (bx<by)
       temp=bx;
       bx=by;
       by=temp;
       if (ax~=bx)||(ay~=by)
           error('向量长度不统一');
       end
   elseif (ax~=bx)||(ay~=by)
       error('向量长度不统一');
   end
   dis=0;
   for i=1:max(ax,ay)
       dis=dis+(A(i)-B(i))^2;
   end
   dis=sqrt(dis);
end

Ending!
更多课程知识学习记录随后再来吧!

就酱,嘎啦!

在这里插入图片描述

注:
我们愈是学习,愈觉得自己的贫乏。 —— 雪莱

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发芽ing的小啊呜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值