机器学习
文章平均质量分 67
小帅吖
无
展开
-
神经网络部分名称
1.Epoch,batch,Iteration名词解释Epoch:使用训练集的全部数据对模型进行一次完整训练,被称之为“一代训练”Batch:使用训练集中的一小部分样本对模型权重进行一次反向传播的参数更新,这一小部分样本成为“一批数据”Iteration:使用一个Batch数据对模型进行一次参数更新的过程,称为“一次训练”2.张量是一种特殊的数据结构,与数组和矩阵非常相似。在 PyTorch 中,我们使用张量对模型的输入和输出以及模型的参数进行编码。张量类似于NumPy 的ndarray,不同之处原创 2021-11-04 18:29:22 · 136 阅读 · 0 评论 -
基于深度强化学习的机器人运动控制研究进展 | 无模型强化学习 | 元学习
1.基于深度强化学习的机器人运动控制研究进展1.1 深度强化学习1.1.1 强化学习简介:强化学习(Reinforcement Learning, RL)利用试错机制与环境进行交互,旨在通过最大化累积延迟奖励(Return)的方式来学习到最优策略。强化学习本质上是通过参数化的函数逼近 “状态-动作”的映射关系,以求解MDP的最优策略。1.1.2 为什么要将深度学习引入强化学习?强化学习受自身结构与学习能力的约束,多以解决低维问题为主,在处理高维连续状态-动作空间下的控制问题时,难以有效求解,且无法原创 2021-11-04 18:27:14 · 5966 阅读 · 2 评论 -
1. Machine Learning
1. Machine Learning概述1.1 什么是MLMachine Learning ≈ Looking for Function两大类任务(回归与分类)1.2 Framework of ML2. 基本步骤(基础版:线性模型)2.1 function with unknown2.2 Define Loss from Training Data2.3 optimization2.4 summary接下来看一下根据我们学习出来的w与b进行预测的结果与真实原创 2021-11-01 21:37:57 · 97 阅读 · 0 评论