《数据挖掘与机器学习》—— 第五章无监督学习作业

阿万古

于 2023-12-13 10:36:06 发布

阅读量1.2k

点赞数 12

分类专栏：课程作业文章标签：数据挖掘机器学习学习

本文链接：https://blog.csdn.net/m0_54127955/article/details/134965808

版权

第五章无监督学习作业及答案

题量: 20 满分: 100

快捷查找：Ctrl+F 在搜索框中输入题目

一. 单选题（共12题）

1. (单选题)下列属于无监督学习的是：

A. kmeans

B. svm

C. 最大熵

D. crf

答案: A: kmeans;

2. (单选题)关于主成分分析PCA说法不正确的是( )

A. 我们必须在使用PCA前规范化数据

B. 我们应该选择使得模型有最大variance的主成分

C. 我们应该选择使得模型有最小variance的主成分

D. 我们可以使用PCA在低纬度上做数据可视化

答案: C:我们应该选择使得模型有最小variance的主成分 ;

3. (单选题)以下对k-means聚类算法解释正确的是( )

A. 能自动识别类的个数,随即挑选初始点为中心点计算

B. 能自动识别类的个数,不是随即挑选初始点为中心点计算

C. 不能自动识别类的个数,随即挑选初始点为中心点计算

D. 不能自动识别类的个数,不是随即挑选初始点为中心点计算

答案: C:不能自动识别类的个数,随即挑选初始点为中心点计算 ;

4. (单选题)简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作( )

A. 层次聚类

B. 划分聚类

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿万古

关注关注

12
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数理逻辑习题集（7）

刘炫320的博客

12-03

5766

写在前面这10道题中，有几道题是有争议的。答案我只能是按照自己解析的理解来。欢迎指正，再次感谢热心网友和牛客网。 1.关于正态分布,下列说法错误的是: A.正态分布具有集中性和对称性 B.正态分布的均值和方差能够决定正态分布的位置和形态 C.正态分布的偏度为0，峰度为1 D.标准正态分布的均值为0，方差为1 参考答案：C解析：偏度（Skewness）是描述某变量取

机器学习（五） -- 无监督学习（1） --聚类1

最新发布

zqx1473的博客

07-23

1206

tips：标题前有“***”的内容为补充内容，是给好奇心重的宝宝看的，可自行跳过。文章内容被“文章内容”删除线标记的，也可以自行跳过。！！”一般需要特别注意或者容易出错的地方。本系列文章是作者边学习边总结的，内容有不对的地方还请多多指正，同时本系列文章会不断完善，每篇文章不定时会有修改。由于作者时间不算富裕，有些内容的《算法实现》部分暂未完善，以后有时间再来补充。见谅！文中为方便理解，会将接口在用到的时候才导入，实际中应在文件开始统一导入。

参与评论您还未登录，请先登录后发表或查看评论

机器学习笔试面试题目二

abc_138的博客

09-26

4万+

1、使用k=1的knn算法, 下图二类分类问题, “+” 和 “o” 分别代表两个类, 那么, 用仅拿出一个测试样本的交叉验证方法, 交叉验证的错误率是多少： A 0% B 100% C 0%到100 D 以上都不是正确答案是： B 解析： knn算法就是, 在样本周围看k个样本, 其中大多数样本的分类是A类, 我们就把这个样本分成A类. 显然, k=1 的knn在上图...

K-means聚类算法

weixin_33912638的博客

06-21

2102

K-means也是聚类算法中最简单的一种了，但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中，那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。聚类属于无监督学习，以往的回归、朴素贝叶斯、SVM等都是有类别标签y的，也就是说样例中已经给出了样例的分类。而聚类的样本中却没有给定y，只有特征x，比如...

一个月刷完机器学习笔试题300题（10）

ZHANG781068447的博客

11-03

3463

第十天 1、在以下不同的场景中,使用的分析方法不正确的有 A 根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级 B 根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式 C 用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫 D 根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女正确答案是： B 预测消费...

《数据挖掘与机器学习》—— 第一章 数据挖掘概述作业

m0_54127955的博客

11-28

1210

题量: 33快捷查找：Ctrl+F在搜索框中输入题目。

《数据挖掘与机器学习》—— 第三章回归算法作业

m0_54127955的博客

11-28

739

1. 假设已经使用python第三方库sklearn创建线性模型实例linear_model，则linear_model.coef中，属性coef的作用是？17. 如果自变量X 和因变量 Y 之间存在高度的非线性和复杂关系，那么树模型很可能优于经典回归方法。13. 分类是预测数据对象的离散类别，回归是用于数据对象的连续取值。14. 回归分析的算法通常有：线性回归、非线性回归、逻辑回归。8. 逻辑回归算法是在线性回归算法的结果上加入什么函数？9. Lasso回归与传统的线性回归方程区别是。

《数据挖掘与机器学习》—— 第四章分类算法作业

m0_54127955的博客

12-13

1670

8. (单选题)下列代码实现的功能是：>>> from sklearn.naive_bayes import GaussianNB>>> gnb = GaussianNB()>>>y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)19. (判断题)对于 PCA 处理后的特征，其朴素贝叶斯特征相互独立的假设一定成立，因为所有主成分都是正交的，所以不相关。15. (单选题)下面有关分类算法的准确率，召回率，F1 值的描述，错误的是？

数据挖掘 / 机器学习——决策树

Lilo_的博客

04-11

4442

第四章决策树一、概述 1. 任务属性分类任务 2. 结构根结点：样本全集内部结点：表示一个特征或属性叶结点：表示一个类 3. 基本算法 4. 生成过程决策树的生成是一个递归过程。有三种情形会导致递归返回：①当前结点包含的样本全属于同一类别，无需划分；②当前属性集为空，或是所有样本在所有属性上取值相同，无法划分；【把当前结点标记为叶结点，将其类别设定为该结点包含样本最多的类别-利用当前结点的后验分布】③当前结点包含的样本集合为空，不能划分。【把当前结点标记为叶结点，但将其类别设定为其父节点所含

机器学习笔试面试题——day4

打死也不读博士

07-13

6105

选择题 2、我们想在大数据集上训练决策树, 为了使用较少时间, 我们可以 A 增加树的深度 B 增加学习率 (learning rate)C 减少树的深度 D 减少树的数量增加树的深度, 会导致所有节点不断分裂, 直到叶子节点是纯的为止. 所以, 增加深度, 会延长训练时间. 决策树没有学习率参数可以调. (不像集成学习和其它有步长的学习方法) 决策树只有一棵树, 不是随机森林。 3、...

分类和聚类&&有监督学习和无监督学习

hyqsong的专栏

07-23

1万+

简单来讲: 有监督 -> 分类（回归） -> 识别； 无监督 -> 聚类 -> 分割； ' -> ' 表示对应关系（ps:这个说法来自于《学习Opencv》这样讲不知道有没有问题，目前我是这样理解的）一、分类和聚类简单地说，分类(Categorization or Classification)就是按照某种标准给对象贴标签(label)，再根据标签来区分归类。简单地

机器学习复习模拟题

热门推荐

LiuSong的博客

02-21

7万+

Q1. 在回归模型中，下列哪一项在权衡欠拟合（under-fitting）和过拟合（over-fitting）中影响最大？ A. 多项式阶数 B. 更新权重 w 时，使用的是矩阵求逆还是梯度下降 C. 使用常数项答案：A 解析：选择合适的多项式阶数非常重要。如果阶数过大，模型就会更加复杂，容易发生过拟合；如果阶数较小，模型就会过于简单，容易发生欠拟合。如果有对过拟合和欠拟合概念不清楚的， Q2关...

聚类(clustering）：一种无指导的学习算法

StarLight-Na

06-06

5754

聚类是一种无监督的学习的结果，聚类的结果就是产生一组集合，集合中的对象与同集合中的对象彼此相似，与其他集合的对象相异。聚类算法是推荐给初学者的算法，因为该算法不仅十分简单，而且还足够灵活以面对大多数问题都能给出合理的结果。

分类和聚类的区别

weixin_38381682的博客

04-06

2380

要知道分类和聚类的区别，了解一下有监督学习和无监督学习。这两个概念算是算法基础，同时也是面试官经常会问到的(小姐姐我就被问到了，当然我回答上来了--)有监督学习训练数据包括输入（features）和输出（lable）。常见的如：逻辑回归，支持向量机，深度学习。无监督学习训练数据只有输入。只能通过特征的相似性对样本聚类。常见的如：K-means，DBSCAN。分类和聚类的区别分类：有训练数据，且训练...

机器学习面试真题1000题详细讲解（八）

MIss-Y的博客

01-26

1万+

python进阶教程机器学习深度学习长按二维码关注进入正文231 SVM模型中, 真正影响决策边界的是支持向量以下哪些算法, 可以用神经网络去构造:1. KNN2. 线...

机器学习习题（15）

刘炫320的博客

02-21

5429

给大家拜个晚年了！在新的9题机器学习习题中，我们主要讲解了4个方面：集成学习里随机森林与GBDT等相关知识，PCA降维的相关知识，聚类算法的相关知识，KNN的相关知识。 1.对于随机森林和GradientBoosting Trees, 下面说法正确的是: 1.在随机森林的单个树中, 树和树之间是有依赖的, 而GradientBoosting Trees中的单个树之间是没有依赖的 ...

机器学习能力自测题——常见简单机器学习问题，帮助理解应用

u011947630的博客

08-03

2万+

转自https://www.cnblogs.com/JZ-Ser/articles/7659920.html 一直苦于没有办法自测一下机器学习知识掌握程度，最近看到一篇Ankit Gupta写的博客：Solutions for Skilltest Machine Learning : Revealed。有40题机器学习自测题，马上可以看看你的机器学习知识能打几分？顺便还能查漏补缺相关术语，...

机器学习笔试题目

北冥有小鱼

07-09

5万+

关于Logistic回归和SVM，以下说法错误的是？ A. Logistic回归可用于预测事件发生概率的大小 B. Logistic回归的目标函数是最小化后验概率 C. SVM的目标的结构风险最小化 D. SVM可以有效避免模型过拟合答案：B，Logit回归本质上是一种根据样本对权值进行极大似然估计的方法，而后验概率正比于先验概率和似然函数的乘积。logit仅仅是最大化似然函数，并没...

《数据挖掘与机器学习》—— 第五章 无监督学习作业

第五章 无监督学习作业及答案

一. 单选题（共12题）

《数据挖掘与机器学习》—— 第五章无监督学习作业

第五章无监督学习作业及答案