机器学习笔试题(一)

欢迎大家指正~~

1.以下说法正确的是()

A.增加模型复杂度,模型在测试集上的准确率就能更好

B.L2正则化的解通常是稀疏的,L1正则化可以使得参数趋向于更平滑

C.对于PCA,我们应该选择使得模型具有最小variance的主成分

D.每次使用K-means算法得到的聚类结果可能会不一样

正确答案:D

解析:

A:增加模型复杂度,模型在测试集上的准确率不一定会更好,可能会过拟合。

B:L1正则化会让一些特征的系数为0,使模型系数化,用于特征选择。而L2正则化只会让一些趋近于0,无法系数化。

C:对于PCA,应该选择的是最大方差的主成分.

2.假设我们想估计A和B这两个参数,在开始状态下二者都是未知的,但如果知道了A的信息就可以得到B的信息,反过来知道了B也就得到了A。可以考虑首先赋予A某种初值,以此得到B的估计值,然后从B的当前值出发,重新估计A的取值,这个过程一直持续到收敛为止,该算法是(      )的算法思想。

A极大似然法

B朴素贝叶斯分类器

CEM算法

D贝叶斯决策论

正确答案C

解析:已知样本数据服从K个概率分布,样本具体属于哪个概率分布未知,概率分布参数也未知,先初始化概率分布的参数,判断各个样本的归属.现在已知样本归属,根据样本数据重新计算参数.为EM算法。

下列哪些方法可以用来对高维数据进行降维:

ALASSO

B主成分分析法

C聚类分析

D小波分析法

E线性判别法

F拉普拉斯特征映射

解析:Lasso(Least absolute shrinkage and selection operator, Tibshirani(1996)) 方法是一种压缩估计,它通过构造一个罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。Lasso 的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化
 

  • 15
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值