![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能
文章平均质量分 50
lyp_20180630
这个作者很懒,什么都没留下…
展开
-
梯度下降法
梯度下降法的原理: 训练模型指的是找到使成本函数(所有样本损失函数的平均值)最小时的参数w,b。 梯度下降法作用在什么地方呢?作用在上述训练阶段,即在反向传播更新参数的过程中,每一步下降中根据下降最快的方向然后更新w,b。 具体为: repeat{ w:=w-αdJ/dw; b:=b-αdJ/dw; } 训练模型的目的是什么?不是找到最好的w和b吗? 随机梯度下降法的应用: 在n个训练样本中,执行一次参数更新需要遍历n个样本,计算n个样本的反向传播值即偏导,然后再进行参数更新。 ...翻译 2021-11-23 21:25:08 · 223 阅读 · 0 评论 -
遗传算法的原理
步骤1:随机初始化一批种群,可以是可行解的集合(可行解就是满足约束条件的解),可以选择对他们进行二进制编码或者字符串编码,便于后面的遗传算子操作。 步骤2:对可行解使用评估函数计算其适应度,并排序。 步骤3:以一种选择方法(比如赌轮盘法)随机选择两个个体进行交叉(即相对应位置互换,交叉概率需提前设定,例如11101和10010交叉后的新个体是11100和10011,最后一个位置交叉了) 步骤4:变异。对交叉后的个体进行变异得到新个体。加入变异得到的新个体数为3,但提前设定的每一轮的个体数要求是5的话,那么还翻译 2021-10-18 15:14:56 · 104 阅读 · 0 评论 -
循环神经网络
为什么选择序列模型 序列数据的例子:语音识别,音乐生成(输入是1,2,3等音符或者空),情感分类(输入一段文字,输出电影评分),视频行为识别,人名识别(给出一段文字,识别出里面的人名) 注:输入输出的长度可以不等。 数学符号 做一张词表,包含很多的词 用one-hot方法表示出句子中的每一个词, 循环神经网络 特点之一:三类参数在每个时间步共享,相同。即Wax,Waa,Wya。 RNN----前向传播的两个公式的由来 RNN的时间反向传播损失是每个时间步的损失和。 不同类型的循环神经网络 (一对翻译 2021-10-11 22:34:31 · 117 阅读 · 0 评论 -
神经网络——基础
1、带有时间序列结构的数据(比如音频)适合用RNN; 图像类数据用CNN。 输入的矩阵形式可以有多种,比如X.shape(m,n)表示数据数据是一个mn的矩阵,m表示训练样本个数,n表示每个向量的维度。Y.(1,m)表示输出是1m的矩阵。 逻辑回归是分类模型,主要用于二分类,是线性分类器的优化版本,参数是sita和w,输出概率的阈值是(0,1),损失函数(误差函数)是对单个样本的,成本函数是对全部样本的,和参数有关。 梯度下降法在逻辑回归中,正向传播获得预测值,反向传播更新参数w和b。 为什么要用激原创 2021-03-20 17:33:53 · 111 阅读 · 0 评论 -
python从入门到精通
1.python程序的执行原理 将python解释器加载进内存—>cpu根据解释器定义的翻译规则翻译并执行程序。原创 2020-11-19 12:26:03 · 56 阅读 · 0 评论