机器学习
文章平均质量分 92
慕梅^
模棱角,退优越,沉下心,听进话,忌清高,冷旁观。
展开
-
[AD-NeRF]由音频和人脸图像合成人脸视频并表现出自然的说话风格------30系显卡实现
我对Tensorflow不是很熟悉,所以直接按照官网的environments.yml安装了,其中的Tensorflow版本使用的Cuda版本为10(我过程中使用的是10.2).而在实际运算的时候我的电脑显卡3060并不支持Cuda10.2.不过我还是没能用conda命令安装,博客最后的pip install 解决了我的问题. (事实上这也是pytorch官网的安装方法)另一个是背景和整个上半身的数据,dataset/Obama/com_imgs(CSDN好像不给放obama的图片,会违规)原创 2023-07-09 23:43:52 · 1609 阅读 · 0 评论 -
[学习笔记] 扩散模型 Diffusion
由浅入深了解Diffusion Model - 知乎 (zhihu.com)Diffusion模型详解_difusion_鬼道2022的博客-CSDN博客扩散模型(Diffusion Model)——由浅入深的理解_WSLGN的博客-CSDN博客扩散模型/Diffusion Model原理讲解_哔哩哔哩_bilibili54、Probabilistic Diffusion Model概率扩散模型理论与完整PyTorch代码详细解读_哔哩哔哩_bilibili。原创 2023-07-07 00:13:46 · 523 阅读 · 0 评论 -
Neck网络 FPN + PAN 改进解读
官方的图其实需要配着文字说明才好阅读,PAN那一列其实与第一列的特征提取层数并不相同,PAN那一列只有降维而已,而N2也就是P2,N2~N5这一列,并不是主干网络的提取特征图,因此这样特征传递需要“穿越”的特征图数量大大减少,几层就到了,特征图保留的也更多的是细节信息了。原创 2023-05-12 19:50:40 · 3152 阅读 · 1 评论 -
Ubuntu+Nvidia驱动+cuda+cudnn环境配置
首先便是双系统的安装,我本身电脑是Windows,装Ubuntu18.04接着遇到了在Ubuntu18.04系统下找不到WiFi适配器解决方法,我后来发现问题与自己电脑牌子的问题,我的电脑是联想拯救者R9000P 2021H,网上看来也有这样的问题,我参考的是下面的博主方法(博主的网络适配器也跟我电脑相同 Realtek系列的RTL8852AE):、原创 2023-03-21 16:23:15 · 537 阅读 · 0 评论 -
[linux] Linux中环境变量配置多个路径
3.source ~/.bashrc 使环境变量生效,这个非常重要,当初更改了环境路径,但是一致没有成功,原因就是没有更新生效/.bashrc文件。由于是学校的服务器,我们当然没有root权限,但是我们可以修改.bashrc文件来修改配置环境,此配置文件永久有效,但是仅针对当前用户。$LD_LIBRARY_PATH :该环境变量主要用于指定查找共享库(动态链接库)时除了默认路径之外的其他路径。下面介绍修改 ~/.bashrc的添加环境变量的方法。CentOS的修改./bashrc文件的命令是。原创 2023-03-17 21:15:12 · 6256 阅读 · 0 评论 -
从PyTorch导出ONNX使用TensorRT模型加速
LInux下TensorRT加速流程原创 2023-03-16 22:53:18 · 1311 阅读 · 2 评论 -
卷积的in_channel与out_channel
也就是说不管卷积核深度是多少(卷积核的深度和要被卷积的原始神经元的深度要一样),而卷积会合并卷积深度为1,我想这才是很多人疑惑的地方,其他的没什么好疑惑的。例如输入的是一张RGB的图片,可以这样来表示(512×512×3),512×512代表图片的大小(512*512个像素点),而RGB图像的深度有三层。(而卷积核的深度与输入的深度一样(为了每一层对应计算嘛),因此卷积核的输入通道往往省略不写)。在我们平时看的网络结构当中,由于卷积核的深度往往与输入的深度相同,因此往往会省略。卷积核的个数=输出通道。原创 2022-02-05 12:54:00 · 10872 阅读 · 8 评论 -
[YOLO] yolov3、yolov4、yolov5改进汇总
每个Res模块前面的CBL都起到下采样的作用,因此经过5次Res模块后,得到的特征图是608->304->152->76->38->19大小。(2)Add:张量相加,张量直接相加,不会扩充维度,例如104×104×128和104×104×128相加,结果还是104×104×128。(1)Concat:张量拼接,会扩充两个张量的维度,例如26×26×256和26×26×512两个张量拼接,结果是26×26×768。5. SPP:采用1×1,5×5,9×9,13×13的最大池化的方式,进行多尺度融合。原创 2023-03-04 16:43:17 · 3013 阅读 · 0 评论 -
[YOLO] yolov3 博客学习笔记汇总
YOLO v2和V3 关于设置生成anchorbox,Boundingbox边框回归的个人理解。CNN中feature map、卷积核、卷积核个数、filter、channel的解读。CNN中feature map、卷积核、卷积核个数、filter、channel。YOLOv3的anchor box的理解、计算以及训练的误差计算。【论文理解】理解yolov3的anchor、置信度和类别概率。YOLO v3整体流程讲解(细节涉及较少)YOLO v3 网络结构计算和解析。YOLOv3网络结构和解析。原创 2023-02-28 20:51:05 · 809 阅读 · 0 评论 -
[Pytorch] CIFAR-10数据集的训练和模型优化
训练模型是个时间较长的过程,如果电脑中有cuda的支持,将可以使用GPU进行训练,减少一定的时间。在神经网络中,有三个部分可以放到GPU中分别是在模型、损失函数以及数据上。首先定义训练设备device然后在程序中模型、损失函数、和数据上使用to函数加入到GPU中。# 模型 model_u = model_u . to(device) # 损失函数 loss_fn = loss_fn . to(device) # 数据 imgs , targets = data。原创 2023-01-30 23:25:02 · 7922 阅读 · 2 评论 -
[Python基础知识] Python序列类型
列表(list), 元组(tuple),集合(set)和字典(dict),及字符串(str)等序列类型相对于其他语言中的近似类型,Python的序列类型功能要强大的多。原创 2022-10-25 15:00:45 · 3966 阅读 · 0 评论 -
[机器学习入门] tensor 是什么 以及 torch.reshape()的使用
torch.reshape()是如何操作的问题背景:假设当我们的dataloader的batch_size设置为64。并且经过卷积(out_channels=6)之后,我们需要使用tensorboard可视化,而彩色图片的writer.add.images(output)的彩色图片是in_channels=3的。那么则需要对卷积后的图片进行reshapeTorch.size(64,6,30,30)---->torch.size(-1,3,30,30)-1的意思为最后自动计算其b原创 2022-02-07 22:52:00 · 10973 阅读 · 1 评论 -
[机器学习入门] 笔记1 卷积神经网络 CNN 的相关概念理解
闭上眼睛思考一下,就懂了。维基百科维基百科写的也蛮好的。不同的领域,会拿不同的例子进行类比。在图像处理里,我暂且将卷积理解为一个卷积核就是规定了周围像素点对当前像素点的产生的影响(类似于g函数,不过与时间无关)。在卷积神经网络的图像预处理中,一个过滤器的卷积核就是规定了,一个像素点会对周围像素点的试探,原创 2022-10-19 16:23:59 · 735 阅读 · 0 评论