自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 神经网络与深度学习-学习总结四

即,输入【提示,模型生成的文本】,输出一个刻画文本质量的标量数字。基于前面提到的预先富集的数据 , 从里面采样prompt输入 ,同时丢给 初始的语言模型和我们当前训练中的语言模型 (policy ) ,得到俩模 型的输出文本 y 1 , y 2。从数据集中随机取出文字和图片后,用图片Encoder和文字Encoder分别压缩成两个embedding向量,然后用余弦相似度来比较图片和文字的embedding向量的相似性,以判断我们随机抽取的文字和图片是否匹配,并根据结果反向更新两个Encoder的参数。

2024-04-27 14:48:32 826

原创 神经网络与深度学习-学习总结三

YOLO的包围框:有 𝑠 2个框,每个框的bb个数为𝐵,分类器可以识别出𝐶种不同的物体, 那么所有整个ground truth的长度为𝑆 × 𝑆 × (𝐵 × 5 + 𝐶) YOLO v1中,这个数量是30 YOLO v2和以后版本使用了自聚类的anchor box为bb, v2版本为𝐵 = 5, v3中 𝐵 =9。FCN中第6、7、8层都是通过1 × 1卷积得到的,第6层的输出通道是4096,第7层的输出通道是4096 ,第8层的输出是1000(类),即1000个特征图(称为heatmap)

2024-04-22 11:09:57 824

原创 神经网络与深度学习-学习总结二

C1层:6个Feature map构成,每个神经元对输入进行5*5卷积,每个神经元对应5*5+1个参数,共6个feature map, 28*28个神经元,因此共有 (5*5+1)*6*(28*28)=122,304连接。stride为2,即pooling核的步长是2, 即2倍降采样.此处的pool1层是有交叠的池化层,即 pooling核在相邻位置有重叠。C5层:120个神经元,每个神经元同样对输入进行5*5卷积,与S4全连接,总连接数(5*5*16+1)*120=48120。用于卷积层与全连接层之后。

2024-04-06 23:54:01 533 1

原创 神经网络与深度学习-学习总结一

然后执行 K 次模型训练和验证,每次在 K−1 个子集上进行训练, 并在剩余的一个子集(在该轮中没有用于训练的子集)上进行验证。神经元间的权值连接仅出现在相邻层之间, 不出现在其他位置。定理2 :若隐层节点(单元)可任意设置,用三层S型非线性特性节点的网络,可以一致逼近紧集上的连续函数或按 范数逼近紧 集上的平方可积函数。(1) 正向传播:输入信号从输入层经隐层,传向输出层,若输出层得到了期望的输出, 则学习算法结束;输出:若为二分类问题,则为0和1,或者是属于某类的 概率,即0-1之间的数。

2024-03-31 16:04:52 635 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除