- 给人脸打上标签再让模型进行学习训练的方法,属于()
- 强化学习 B. 半监督学习 C. 监督学习 D. 无监督学习
- 在机器学习中,用计算机处理一副图像,维度是:
- 上万维 B. 二维 C. 三维 D. 一维
- 以下关于降维的说法不正确的是?
A.降维是将训练样本从高维空间转换到低维空间
B.降维不会对数据产生损伤
C.通过降维可以更有效地发掘有意义的数据结构
D.降维将有助于实现数据可视化 - 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
A.频繁模式挖掘
B.分类和预测
C.数据预处理
D.数据流挖掘 - 以下哪种技术对于减少数据集的维度会更好?
- 删除缺少值太多的列
B.删除数据差异较大的列
C.删除不同数据趋势的列
D.都不是
- 回归问题和分类问题的区别是?
A.回归问题有标签,分类问题没有
B.回归问题输出值是离散的,分类问题输出值是连续的
C.回归问题输出值是连续的,分类问题输出值是离散的
D.回归问题与分类问题在输入属性值上要求不同 - 向量x=[1,2,3,4,-9,0]的L1范数是多少?
A.1
B.19
C.6
D.sqrt(111) - 假设有100张照片,其中,猫的照片有60张,狗的照片是40张。
识别结果:TP=40,FN=20,FP=10,TN=30,则可以得到:( )。
A.Accuracy=0.8
B.Precision=0.8
C.Recall=0.8
D.以上都不对 - 下列哪种方法可以用来缓解过拟合的产生:( )。
A.增加更多的特征
B.正则化
C.增加模型的复杂度
D.以上都是
10. 以下关于PCA说法正确的是 ( )。
A.PCA是一种监督学习算法
B.PCA在转换后的第一个新坐标轴选择的是原始数据中方差最小的方向
C.PCA转换后选择的第一个方向是最主要特征
D.PCA不需要对数据进行归一化处理
11.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
A.关联规则发现
B.聚类
C.分类
D.自然语言处理
12.下面哪些是分类算法?
A.根据肿瘤的体积、患者的年龄来判断良性或恶性?
B.根据用户的年龄、职业、存款数量来判断信用卡是否会违约?
C.身高1.85m,体重100kg的男人穿什么尺码的T恤?
D.根据房屋大小、卫生间数量等特征预估房价
13.影响KNN算法效果的主要因素包括( )。
A.K的值
B.距离度量方式
C.决策规则
D.最邻近数据的距离
15.支持向量机有哪些常用的核函数( )。
A.高斯核
B.拉普拉斯核
C.线性核
D.