【20200310】数据挖掘课程课业打卡一


叮嘟!这里是小啊呜的学习课程资料整理。好记性不如烂笔头,今天也是努力进步的一天。一起加油进阶吧!
在这里插入图片描述

课业打卡一之数据挖掘绪论

一、单选题

1、下列选项哪个描述的是“训练样本”

A、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果
B、在电子病历数据中,每一个样本有八个检测指标,每个样本还有一个医生诊断结果
C、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果;算法自动得到这些样本的诊断结果
D、在电子病历数据中,每一个样本有八个检测指标,医生根据这八个指标做出诊断
正确答案: B

题目涉及知识点:

  • 训练样本训练过程中所使用的属性和类别都已知的数据对象即为训练样本 。
  • 训练过程:通过寻找其中的规律 ,得到一个目标函数或分类规则 。
  • 测试样本 :测试过程中所使用的属性值已知但类别未知的数据对象即为测试样本 。
  • 测试过程:使用目标函数或分类规则,预测每个测试样本的类别 。

2、下列选项哪个描述的是“分类”

A、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果
B、在电子病历数据中,每一个样本有八个检测指标,每个样本还有一个医生诊断结果
C、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果;算法自动得到这些样本的诊断结果
D、在电子病历数据中,每一个样本有八个检测指标,医生根据这八个指标做出诊断
正确答案: C 

题目涉及知识点:

分类定义

在这里插入图片描述

3、下列哪个选项描述的不是“聚类”

A、搜索引擎返回的文档中,将相似的文档聚合成一类
B、电子商务网站数据中,购物历史相似的用户自动聚合成一组
C、电子商务网站数据中,分析出用户常常一起购买的商品,组合到一起促销
D、在电子病历数据中,将体检指标相似的样本自动聚合成一组
正确答案: C 

题目涉及知识点:
聚类定义
旨在发现紧密相关的观测值组群 ( 簇 ), 使得与属于不从簇的观测值相比 , 属于同一簇的观测值相互之间尽可能类似

4、在MATLAB语言中,以下说法中错误的是()

A、MATLAB中默认的数据类型是double
B、3<5的运算结果是logical类型
C、变量Abc和abc是代表两个相同的变量
D、灰度图的图像矩阵中的数据是uint8类型
正确答案: C 

二、多选题

1、引发人们对数据挖掘开展研究的挑战性问题包括(多选) :

A、可伸缩
B、高维性
C、异种数据和复杂数据
D、数据的所有权与分布
E、非传统的分析
正确答案: ABCDE 

2、下列哪些属于预测性任务(多选)

A、关联规则发现
B、分类
C、 回归
D、 聚类
正确答案: BC 

3、下列哪些属于描述性任务

A、关联规则发现
B、分类
C、回归
D、聚类
正确答案: AD 

三、填空题

1、执行完matlab命令“a=[1, 2; 2, 3; 6, 10]”之后,a中的数据有_行_ 列

正确答案:3;2

2、执行完matlab命令“a=[2:3:10]”之后,a中的数据依次为 __ 、__ 、__ 。

正确答案:2;5;8

3、执行完matlab命令“a=[1, 2; 4, 3; 6, 10]”之后,a(3,2)的值为___。

正确答案:10

知识点汇总

1、数据挖掘五大任务

在这里插入图片描述

2、关于数据挖掘定义

定义1:
在大型数据存储库中,自动地发现有用信息的过程

 Exploration & analysis, by automatic or semi-automatic means, of large quantities of data in order to discover meaningful patterns.

定义2:
从大型数据集中提取有趣的 ( ( 非平凡的 , 蕴涵的 , 先前未知的并且是潜在有用的 ) 信息或模式。

 Non-trivial extraction of implicit, previously unknown and potentially useful information from data.

3、简例判断数据挖掘

Ending!
更多课程知识学习记录随后再来吧!

就酱,嘎啦!

在这里插入图片描述

注:
我们愈是学习,愈觉得自己的贫乏。 —— 雪莱

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
NTU60数据集的预处理原理是将原始的RGB-D视频数据转换为可以用于动作识别的特征表示。具体的预处理步骤如下: 1. 视频采集:数据集中的视频是通过Kinect 2.0设备进行采集的,包括RGB图像和深度图像。 2. 数据对齐:由于RGB图像和深度图像采集时存在时间上的偏差,需要进行对齐操作,确保它们在时间上是同步的。 3. 特征提取:从对齐后的RGB图像和深度图像中提取特征。常用的特征包括颜色直方图、深度直方图、骨骼关节位置等。 4. 数据归一化:将提取到的特征进行归一化处理,以确保不同数据之间的尺度一致性。 5. 数据降维:由于原始的特征维度可能比较高,可以使用降维算法(如主成分分析)将特征维度减少,以提高计算效率和减少存储空间。 通过以上预处理步骤,我们可以得到适合用于动作识别的特征表示。这些特征可以用于训练机器学习模型,如支持向量机(SVM)或深度学习模型,以实现对动作的识别和分类。这样就可以利用NTU60数据集进行动作分析和相关研究了。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [关于NTU-RGB+D数据集skeleton数据](https://blog.csdn.net/qq_39413349/article/details/109588050)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [【20200429】数据挖掘DM课程课业八之支持向量机](https://blog.csdn.net/qq_43543789/article/details/105921791)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

发芽ing的小啊呜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值