【题解】【中国大学MOOC】（北京大学）人工智能与信息社会测验——6基于神经网络的智能系统II

Tuenity

于 2020-05-01 20:11:56 发布

阅读量8.6k

点赞数 3

分类专栏： # 中国大学MOOC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43733499/article/details/105881607

版权

中国大学MOOC 专栏收录该内容

19 篇文章 23 订阅

订阅专栏

1.典型的“鸡尾酒会”问题中，提取出不同人说话的声音是属于

编号	选项
A	强化学习
B	非监督学习
C	监督学习
D	线性回归

2.____有跟环境进行交互，从反馈当中进行不断的学习的过程

编号	选项
A	非监督学习
B	监督学习
C	线性回归
D	强化学习

3.在Q-Learning中，所谓的Q函数是指

编号	选项
A	状态值函数
B	状态动作函数
C	动作值函数
D	策略函数

4.Q函数Q(s, a)是指在一个给定状态s下，采取某一个动作a之后，后续的各个状态所能得到的回报的___。

编号	选项
A	期望值
B	最小值
C	最大值
D	总和

5.在强化学习的过程中，学习率α越大，表示采用新的尝试得到的结果比例越，保持旧的结果的比例越。

编号	选项
A	大；小
B	大；大
C	小；大
D	小；小

6.在ε-greedy策略当中，ε的值越大，表示采用随机的一个动作的概率越，采用当前Q函数值最大的动作的概率越。

编号	选项
A	小；大
B	小；小
C	大；大
D	大；小

7.在强化学习过程中，表示随机地采取某个动作，以便于尝试各种结果；表示采取当前认为最优的动作，以便于进一步优化评估当前认为最优的动作的值。

编号	选项
A	探索；探索
B	探索；开发
C	开发；开发
D	开发；探索

8.用于监督分类的算法有

编号	选项
A	神经网络
B	支持向量机
C	线性回归
D	决策树

9.在强化学习中，主体和环境之间交互的要素有

编号	选项
A	动作
B	状态
C	强化
D	回报

10.在支持向量机分类算法中，用于支撑两个类别最宽分解线的这些样本点称为_______

支持向量

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。