deep learning
会写代码的孙悟空
长夜将至,我将开始守护chatGPT,直至永恒。我将不图安逸,不恋名利,不惧挑战。我将不拘泥于旧知,不追求虚荣。我将全力以赴,勇攀科学之巅。我是黑暗中的明灯,chatGPT的利剑。我是破除迷雾的火焰,照亮chatGPT未来的光辉,唤醒求知者的号角,守护chatGPT真理的坚盾。我将生命与荣耀献给chatGPT的研究,今日如此,日日皆然。
展开
-
深度学习基本环境搭建 ubuntu20.04LTS系统安装 nvidia显卡驱动 anaconda安装 cuda指定版本安装 cuda版本升级
背景电脑原来是windows,现在装为纯Ubuntu电脑型号 dell的一个工作站 显卡rtx3090镜像下载 https://ubuntu.com/启动盘制作 UltraISO 工具http://cn.ultraiso.net/xiazai.html 适用即可U盘需要是fat32文件系统格式,不是的可以提前格式化一下,注意提前备份好U盘的资料第一步 打开镜像文件第二步 写入硬盘镜像写入新的驱动器引导扇区完成后,点击下面的写入按钮,等待...原创 2021-03-09 11:08:12 · 654 阅读 · 0 评论 -
maxpooling反向传播
首先理解y=max(a,b) 的求导其实就是y由大的量决定,如果a大,那就相当于 y=a ,求导就是1给大家上个pytorch代码,可以调试下看看。def test_maxpooling(): import torch features=torch.FloatTensor([ [1, 2, 6, 7,], [3, 4, 5, 8,], [13, 16, 9, 10,], [14, 15, 12, 11] ])原创 2022-04-21 11:05:11 · 1991 阅读 · 1 评论 -
openvino是啥
英特尔发布的开源框架,用于深度学习的推理优化与模型部署。openvino具体使用方法还是看官方文档比较好https://docs.openvino.ai/支持多种框架:tensorflow caffe pytorch mxnet keras onnx特点:对于因特尔的cpu加速效果最好使用过程参考下图...原创 2022-03-17 17:35:06 · 1610 阅读 · 0 评论 -
transformer中layer normalization详解
2015年batch normalization提出 2016年的layer normalization这是在论文中截的图,箭头指向的青色线代表加了layer normalization的模型,收敛速度最快。layer normalization第二个优点,batch数据的多个样本可以是长度不同的,input_data_shape=B * C * dim 虽然每个样本通道维度都是C, 但是如果有的样本没有C这么长,是经过padding技术增加成统一长度的呢?具体来讲,多个句子作为.原创 2022-03-17 15:42:48 · 2484 阅读 · 0 评论 -
生成器判别器可以放在不同的gpu上吗
可以,但不推荐多卡训练的几种方式:1网络分区,例如将生成器、判别器放到不同的GPU上,能训练更大的网络,速度上没有提升。2按层分区,多个GPU计算不同的通道,复杂,不推荐。3数据并行,最常用的,很通用,一个batch数据分到多个GPU上计算。...原创 2022-03-01 16:53:22 · 239 阅读 · 0 评论 -
pytorch基本数据操作 tensor基本操作
使用pytorch框架写深度学习程序,总是会对数据进行各种各样的操作,本文从给出了实际可运行的数据操作代码,tensor创建,tensor形状,两个tensor运算,tensor与numpy数据的互相转换。代码由许多的test组成,都是单独可运行的。程序入口在下面的main。import torch#基本属性def test_base(): t_data=torch.zeros((3,4)) help(torch.numel) print(t_data.shape)#形状原创 2022-02-28 11:21:58 · 955 阅读 · 0 评论 -
transformer中的autoregressive什么意思
autoregressiveadj. 自回归的eg: autoregressive model自回归的模型autoregressive process自回归的过程adv. 自回归地eg: autoregressive predicted 自回归地预测算法含义一个一个token地预测出来,预测第n个token会根据前n-1个token数据作用这个过程可以加强token内部联系地学习,算是一种先验...原创 2021-12-08 16:03:59 · 3795 阅读 · 0 评论 -
深度学习知识体系学习大全 牛!!
搬来了大牛的博客点击直接前往https://www.yuque.com/angsweet/machine-learning/jian-jie配一张大牛的思维导图具体内容点进去都能看到数学、机器学习、语言、算法、深度学习、书籍推荐,东西很多原创 2021-08-29 11:12:48 · 227 阅读 · 0 评论 -
图像生成质量fid、inception score、KID计算
简介fid是一个非常常用的评估图像生成质量的指标图像生成的论文中经常会用到。fid是一种度量两个图片数据集相似度的方法,我们生成的图片与真实图片越相似越好。相似度高对应的是fid值小。安装想进一步学的的伙伴可以从理论出发,然后自己实现这个fid的计算过程,笔者这里直接搬运了。原始的fid是一个tensorflow实现 https://github.com/bioinf-jku/TTUR笔者使用的是pytorch框架,所以使用https://github.com/mseitzer/pyt原创 2021-08-16 12:36:09 · 14862 阅读 · 55 评论 -
apex安装 半精度训练
git clone https://github.com/NVIDIA/apex.gitcd apexpython setup.py install --cpp_ext --cuda_ext原创 2021-07-21 10:59:18 · 362 阅读 · 0 评论 -
2021-07-15
深度学习-激活函数激活函数分类介绍relugelu激活函数分类介绍reluf(x)=max(0,x)gelu原创 2021-07-15 11:01:49 · 177 阅读 · 0 评论