![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习之路
文章平均质量分 93
m0_59838738
这个作者很懒,什么都没留下…
展开
-
迁移学习(Transfer learning)相关名词解释
摘录总结自:请问具体什么是迁移学习? - 知乎迁移学习概念:从广义上讲,利用已有的知识、模型、结构来帮助我们达成在目标数据上的学习目标。因此,迁移学习可以细分为很多不同的研究子领域。文献:Sinno Pan and Qiang Yang, A survey on transfer learning. IEEE TNN 2010迁移学习的第一大范式:Pre-train and fine-tune(预训练-微调)是迁移学习最重要的表现形式,指的是在源领域训练好一个网络,直接将其用于目标域的数原创 2021-11-11 12:39:38 · 2772 阅读 · 0 评论 -
Value-based learning(价值学习)入门(使用DQN)
以下内容总结自B站:深度强化学习(Deep Reinforcement Learning)_哔哩哔哩_bilibili一、概述:Value-based learning(价值学习):使用神经网络Deep Q network(DQN)来近似学习;使用时间差分(TD:temporal different)算法来训练DQN,即学习神经网络的参数。二、概念回顾:1、基于策略的动作价值函数(Action-value function):,表示时刻状态下做动作之后能获得的回报的期望。是回报.原创 2021-10-20 16:58:05 · 833 阅读 · 0 评论 -
强化学习入门概览
把机器学习按照学习方式分类:监督式学习、无监督式学习、半监督式学习、强化学习。以下内容总结自B站:深度强化学习(Deep Reinforcement Learning)_哔哩哔哩_bilibili以超级玛丽游戏为例,介绍强化学习基本概念(有些不太严谨,但是能快速入门):Agent(智能体):马里奥Environment()State(状态):超级玛丽游戏的一帧画面Action(动作):马里奥做的动作,比如:向上跳,前进,后退。RewardPolicy(策略),根据状态,做原创 2021-10-12 22:15:00 · 1154 阅读 · 0 评论 -
吴恩达神经网络和深度学习-week4-编程作业1-逐步搭建神经网络(Building your Deep Neural Network: Step by Step)要点整理
作业目的:实现分类预测的L层深度神经网络的所有函数。搭建步骤:一、初始化神经网络的所有参数,包括从1到L-1层的W和b(第0层为输入特征)(一)要点:初始化权重矩阵W[l],使用np.random.randn(shape) * 0.01,其中,shape为(第l层的神经元个数,第l-1层的神经元个数),np.random.randn()生成一组服从“0~1”均匀分布的随机样本值。随机样本取值范围是[0,1),不包括1。乘以0.01是为了确保W的值很小,从而使Z[l]=W[l]X+b[l]原创 2021-07-20 23:08:30 · 756 阅读 · 1 评论 -
吴恩达神经网络和深度学习-week3-浅层神经网络的要点记录
本文所有截图来自于吴恩达深度学习课视频课程。1、神经网络的表示上图是一个双层神经网络的例子,包括一层隐藏层和一层输出层,输入层不算做标准层,有时也将输入层成为第0层。下图详细描述了神经网络的主要构成:最左边是输入层,输入层的x1, x2, x3是样本x的三个特征值(上图只是一个样本的例子),例如:一张图片中,使用R、G、B三个通道的值来表示一个像素点,那么x1, x2, x3就对应这三个通道的值。输入层的激活值写为a^[0],即x=a^[0].中间四个神经元是隐藏层,上图只...原创 2021-07-03 19:25:12 · 299 阅读 · 0 评论 -
吴恩达神经网络和深度学习-week2-编程作业-具有神经网络思维模式的Logistic回归(Logistic Regression with a Neural Network mindset)要点整理
作业目的:用神经网络构建一个Logistic回归分类器来识别猫。问题集概述:训练集为209张64✖64的图像和它们的分类值(1表示是猫,0表示不是猫);测试集为50张64✖64的图像。学习算法的通用架构:初始化参数; 计算成本函数(cost function)及其梯度(gradient); 使用优化算法(梯度下降:gradient descent),使成本(cost)最小化。将以上三个函数集成在一个主模型函数中即可。步骤概述:一、数据集预处理(一)熟悉你的数据集,.原创 2021-06-30 22:30:15 · 439 阅读 · 0 评论