读书笔记《神经网络与深度学习》

读书笔记《神经网络与深度学习》

机器学习是人工只能的一个分支,机器学习本身是一个非常大的概念。

机器学习是通过算法从大量历史数据中学习规律,从而对新的样本做智能识别或未来做预测

机器学习按照学习方式分类:

  • 监督学习

  输入数据包括:历史数据、正确期望值、错误期望值

  • 非监督学习

  输入数据后有模型自行进行聚类、规则区分

  • 强化学习

  一个连续决策的过程,其数学本质是马尔科夫决策过程


  马尔科夫过程:对于一个系统,有一个状态转移到另一个状态的过程中,存在着转移概率,且转移概率可以通过前一种状态计算出来,且与该系统的原始状态和此次转移前的马尔科夫状态无关。
  马尔可夫决策过程:指决策者周期地或连续地观察具有马尔可夫性的随机动态系统,序贯地作出决策。即根据每个时刻观察到的状态,从可用的行动集合中选用一个行动作出决策,系统下一步(未来)的状态是随机的,并且其状态转移概率具有马尔可夫性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值