机器学习练习题(1)+详细解析

一。单选题
1.线性回归能完成的任务是(B)
A。预测离散值
B.预测连续值
C。分类
D。聚类

解析:线性回归能完成的任务是预测连续值

知识点扩展:
机器学习:

  1. 有监督学习,有x有y(y即label标签)
    (1.)分类:预测结果是离散值,例如颜色和形状;

(2.)回归:预测结果是连续值(断断续续),例如气温,体温,血压等;

2.无监督学习,有x没有y(只有数据,没有标签)
(1.)聚类:将相似的数据进行分堆;
(2.)降维:用于简化数据,减少训练开销

3.模型评估指标
检验模型是否优良的工具

4.数据预处理
样本进入训练之前的准备工作。目的是使数据更完善。

在这里插入图片描述

2.下列两个变量之间的关系中,那一个是线性关系(D)

A.学生的性别与他(她)的数学成绩
B.人的工作环境与他的身体健康状况
C.儿子的身高与父亲的身高
D.正方形的边长与周长

解析:
A,B,C三个选项中前后两个变量之间都存在一定的影响,但是并不一定可以构成线性关系。

思维引导:什么是线性回归?
(1.)什么是线性?
函数里面的自变量和因变量之间的对应关系在集合呈现直线(平面或者超平面)

在这里插入图片描述

(2.)什么是回归?
用一条直线(平面或者超平面)来拟合真实世界中的一些规律

好,那么什么是线性回归呢?
线性回归就是用自变量和因变量之间的对应关系呈现一条直线的函数来进行拟合现实生活中的一些规律。

3.产量(X,台)与单位产品成本(y,元/台)之家你的回归方程为y=356-1.5x,这说明(D)

A。产量每增加一台,单位产品成本增加356元

B。产品每增加一台,单位产品的成本减少1.5元

C.产量每增加一台,单位产品的成本平均增加356元

D。产量每增加一台,单位产品成本平均减少1.5元

解析:首先观察这个函数,y=356-1.5x,这条直线的斜率是负值,从直线可以看出,y与x之间呈反比关系。可是根据实际情况而言,当产量越来越多的时候,成本就越来越少,那么当x无限接近于正无穷的时候,x岂不是为负值了吗???不知道你们远不愿意,反正如果是我的话,我肯定不愿意。所以说他只是在某一个阶段符合上述条件。当x=1,y=354.5;当x=2,y=353;x=3,y=351.5;将这三个数进行计算,平均值是1.5.所以正确答案为D

在这里插入图片描述
(画的比较形象,关键在于说明问题,大家把关键点放在问题上哈!(ૢ˃ꌂ˂ૢ)(ૢ˃ꌂ˂ૢ))

4.以y true 表示观测值,y hat 表示回归估计值,则普通最小二乘法估计参数的准则是 (D)

在这里插入图片描述解析:普通最小二乘法估计参数的准则是使误差平方和最小
如果在D的选项上乘以1/m ,那么正确答案还是D

5.直线方程y=wx+b,其中b表示(B)
A.系数 B截距
C.斜率 D权重

解析:在机器学习中 w表示系数,斜率和权重,b表示截距

二。多选题
1.以下描述中,对梯度解释正确的是(AB)
A梯度是一个向量,有方向有大小
B求梯度就是对梯度向量的各个元素求偏导
C梯度只有大小没有方向
D梯度只有方向没有大小
解析:theta是一个几行几列的矩阵,求偏导之后还是一个矩阵。所以说梯度是一个向量,有方向有大小。定义,求梯度就是对梯度向量的各个元素求偏导。

2.解析解的缺点是(ABC)
A随着样本和特征数量的增加,计算量呈爆炸式增长
B计算过程占用非常巨大的空间
C有些样本的特征矩阵不能求逆,到值无法求解
D不能求出全局最优解

解析:解析解为自变量和因变量所表示的解析式(比如求根公式之类的),换句话说就是用参数表示的解。是方程的精确解,能在任意精度下满足方程。

与之类似的还有数值解和闭式解。
数值解就是在一定的条件下通过某种近似计算得出来的一个数值,能在给定的精度条件下满足方程

闭式解为一个封闭形式的函数,因此对任一独立的变量,都可以把它代入解析函数求得正确的相关变量。因此解析解也叫闭式解

解析解的缺点就是随着样本和特征数量的增加,计算量呈爆炸式增长,增长后计算会占用非常巨大的空间。解析解中的函数有的会有矩阵的转逆,如果某些样本特征矩阵不能求逆,则会导致无法求解。

解析解是可以求出全局最优解的,全局最优解就是一个函数的最低点(凸函数)。还有一个就是局部最优解(深度学习中比较常见,非凸函数)

3.关于误差ε的说法正确的是(ABEF)
A 误差可以看做随机比变量
B误差的概率分布符合正态分布
C误差的概率分布符合均匀分布
D如果模型设计优良,误差可以避免
E误差不可以避免,因为采集的信息不够完备
F误差等于y真实值与y预测值的差值

解析:误差是y true 与y hat的差值,它的值是不固定的,他是可以看做随机变量的。误差的概率分布符合正态分布的规律。从生活中获取到的数据是不完备的,误差是不可以避免的。

4.标准差与方差的关系是(ABC)
A标准差是方差的算术平方根
B标准差可以反映离散程度,也可以反映出样本的量纲
C方差只能反映离散程度
D标准差的平方是方差

解析:标准差是方差的算术平方根,标准差的平方是方差,标准差可以反映数据的离散程度,也可以反映样本的量纲

知识点扩展:什么是量纲?

量纲是物理朗的最基本属性,是定性的,不能用数字来表示。例如面积和长度

什么是无量纲?
无量纲:这是量纲的通式。式中的指数如α,β,γ…这些称谓量纲指数,全部指数均为0的物理量称为无量纲量。

量纲和单位的区别是什么?

量纲是一个物理量的最基本的属性。如面积,长度
单位是面积中的平方米,平方厘米,长度中的米,厘米等等
*量纲是定性的,单位是定量的

5.下列哪些算法属于最优解算法(AC)
A解析解
B最小二乘法
C梯度下降法
D最大似然估计

解析:解析解和梯度下降大属于最优解算法,最大似然估计和最小二乘法只算是算法中的一种,用来进行测评的,不能算是最优解算法。

ps:题是我们的周考题,解析是我自己写的。如果大家有更好的见解,欢迎大家来找我探讨。(ૢ˃ꌂ˂ૢ)(ૢ˃ꌂ˂ૢ)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值