【题解】【中国大学MOOC】(北京大学)人工智能与信息社会测验——6基于神经网络的智能系统II

1.典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于

编号选项
A强化学习
B非监督学习
C监督学习
D线性回归

2.____有跟环境进行交互,从反馈当中进行不断的学习的过程

编号选项
A非监督学习
B监督学习
C线性回归
D强化学习

3.在Q-Learning中,所谓的Q函数是指

编号选项
A状态值函数
B状态动作函数
C动作值函数
D策略函数

4.Q函数Q(s, a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的___。

编号选项
A期望值
B最小值
C最大值
D总和

5.在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越____,保持旧的结果的比例越____。

编号选项
A大;小
B大;大
C小;大
D小;小

6.在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越____,采用当前Q函数值最大的动作的概率越____。

编号选项
A小;大
B小;小
C大;大
D大;小

7.在强化学习过程中,____表示随机地采取某个动作,以便于尝试各种结果;____表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

编号选项
A探索;探索
B探索;开发
C开发;开发
D开发;探索

8.用于监督分类的算法有

编号选项
A神经网络
B支持向量机
C线性回归
D决策树

9.在强化学习中,主体和环境之间交互的要素有

编号选项
A动作
B状态
C强化
D回报

10.在支持向量机分类算法中,用于支撑两个类别最宽分解线的这些样本点称为_______

支持向量
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值