小白学视觉
文章平均质量分 61
小崔的技术博客
写出来才算
展开
-
VideoAssembler 一种新颖的方法,生成具有多样化内容的视频的方法
VideoAssembler 一种新颖的方法,生成具有多样化内容的视频原创 2023-12-07 11:01:45 · 199 阅读 · 0 评论 -
跨模态检索综述
跨模态检索问题综述原创 2023-05-30 12:09:15 · 2556 阅读 · 1 评论 -
安装horovod遇到的问题
安装horovod遇到的问题,Horovod是一种分布式深度学习框架,可在多个GPU服务器之间执行深度学习模型训练。 Horovod的设计目的是使分布式训练尽可能简单,开发人员只需稍微修改现有的单机代码即可实现分布式训练。与其他分布式深度学习框架相比,Horovod具有出色的可伸缩性和效率,并且能够应对处理大型数据集训练的需要。Horovod支持多种深度学习框架,例如TensorFlow,PyTorch和Keras等。原创 2023-05-25 21:47:34 · 1270 阅读 · 0 评论 -
No module named ‘pycocotools._mask‘
No module named ‘pycocotools._mask‘ 运行深度学习代码遇到的问题原创 2023-05-25 14:55:12 · 565 阅读 · 0 评论 -
BLIP论文中疑难点汇总
BLIP问题汇总和解答原创 2023-05-18 16:32:14 · 679 阅读 · 1 评论 -
BLIP模型中的一些术语解读
BLIP模型中的一些术语解读原创 2023-05-18 10:45:01 · 824 阅读 · 0 评论 -
senet模型代码解读
senet代码解读原创 2023-05-17 15:15:29 · 574 阅读 · 0 评论 -
ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked Global-Local Attention Network
ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked Global-Local Attention Network的代码解读原创 2023-05-17 14:19:36 · 254 阅读 · 0 评论 -
RuntimeError: view size is not compatible with input tensor‘s size and stride解决办法
RuntimeError: view size is not compatible with input tensor‘s size and stride解决办法原创 2023-05-17 09:47:43 · 1926 阅读 · 0 评论 -
3090显卡安装cuda11.3 (Windows10)
3090显卡装深度学习环境,cuda,cudnn,pytorch原创 2023-05-16 20:51:30 · 597 阅读 · 0 评论 -
由8张显卡跑深度学习实验的代码,怎么改成单卡运行
深度学习代码多卡改单卡方法原创 2023-05-16 12:32:51 · 1293 阅读 · 0 评论 -
BLIP:Bootstrapping Language-Image复现
BLIP复现过程原创 2023-05-15 16:23:37 · 629 阅读 · 6 评论 -
多模态大模型 Blip代码解读
多模态Blip代码解读原创 2023-05-15 16:14:30 · 606 阅读 · 0 评论 -
动作检测方向论文代码数据集总结
动作检测方向论文代码数据集总结,网址总结原创 2023-03-30 20:51:22 · 123 阅读 · 0 评论 -
浏览器常用书签整理
浏览器常用书签整理原创 2023-03-30 20:34:29 · 215 阅读 · 1 评论 -
一台Ubuntu跑多个深度学习实验的方法
一台Ubuntu跑多个深度学习实验的方法,tmux原创 2023-03-30 20:08:24 · 160 阅读 · 0 评论 -
搜索论文的方法
介绍了如何搜索论文和整理论文原创 2023-03-30 09:47:08 · 337 阅读 · 0 评论 -
windows中的txt文件复制到Linux中遇到的 \r 问题
windows中的txt文件复制到Linux中遇到的 \r 问题,格式不一致原创 2023-03-25 11:34:07 · 679 阅读 · 2 评论 -
多模态图像识别
多模态图像识别技术的调研原创 2023-03-21 22:10:45 · 1480 阅读 · 0 评论 -
latex 知识点总结
LaTeX编辑器使用方法,语法总结原创 2023-03-21 17:19:11 · 595 阅读 · 0 评论 -
win10 cuda11.8 和torch2.0 安装
win10 cuda11.8 和torch2.0 安装,pytorch 新版本原创 2023-03-21 16:46:42 · 8659 阅读 · 1 评论 -
CLIP-TSA: CLIP-Assisted Temporal Self-Attention for Weakly-Supervised Video Anomaly Detection论文阅读笔记
CLIP-TSA: CLIP-Assisted Temporal Self-Attentionfor Weakly-Supervised Video Anomaly Detection 论文阅读笔记原创 2023-03-20 16:11:32 · 725 阅读 · 1 评论 -
深度学习激活函数论文总结
深度学习激活函数论文阅读笔记原创 2023-03-20 12:13:34 · 1501 阅读 · 0 评论 -
如何成为一名深度学习和算法工程师
成为一名算法工程师需要做哪些努力,需要注重哪些提高原创 2023-03-18 13:35:27 · 162 阅读 · 0 评论 -
ubuntu深度学习验环境部署和远程跑实验
ubuntu深度学习验环境部署和远程跑实验,试验的安装,部署,后台执行原创 2023-03-18 13:17:19 · 135 阅读 · 0 评论 -
ChatGPT的初步学习和认识
ChatGPT功能介绍和学习原创 2023-03-16 20:27:18 · 5165 阅读 · 0 评论 -
CNN的发展情况归纳
CNN学习笔记归纳原创 2023-03-07 23:02:25 · 821 阅读 · 1 评论 -
使用一个U盘轻松安装多个系统的神器ventoy
Ventoy官网ventoy是一个开源软件。第一步:下载安装后只需要插入U盘制作就可以了。制作完成后你的U盘名字就是ventoy。第二步:然后将各个系统的ISO镜像拖入到ventoy中就可以了。第三步:设置开机启动项第四步:选择你要安装的系统的ISO第五步:安装系统...原创 2021-08-13 23:26:37 · 2276 阅读 · 0 评论 -
GAN网络的详细内容
GAN网络的概念:GAN网络的基本思想:GAN网络的整体结构GAN网络的训练过程:每一次迭代:更新判别器的网络参数。即给定假图片以及假图片的标签(上图中的generated example)、真图片以及真图片的标签(上图中的real example),让判别器能够区别出真假图片,也就是训练一个尽可能准确的二分类器。 固定判别器网络参数, 更新生成器网络。即给定假图片以及假标签(让判别器以为假图片是真的),从而误差反向传播来更新生成器,使得生成器生成更加逼真的照片。.原创 2021-05-08 20:17:37 · 3734 阅读 · 0 评论 -
FID图像质量评估指标
FID(Fréchet Inception Distance)FID是从原始图像的计算机视觉特征的统计方面,来衡量两组图像的相似度,是计算真实图像和生成图像的特征向量之间距离的一种度量。这种视觉特征是使用 Inception v3 图像分类模型提取特征并计算得到的。FID 在最佳情况下的得分为 0.0,表示两组图像相同。分数越低代表两组图像越相似,或者说二者的统计量越相似FID 分数常被用于评估由生成对抗网络(GAN)生成的图像的质量,较低的分数与较高质量的图像有很高的相关性。在 python原创 2021-05-08 20:10:09 · 26581 阅读 · 0 评论 -
深度学习损失函数总结
概念: 损失函数是用来测量模型的预测值F(X)和真实值Y的不一致程度,通常用L(y,f(x))来表示,他又可以叫代价函数(Cost Function)。损失函数越小,代表模型拟合的越好,在损失函数达到最优时,我们可以说:模型的经验风险最小化.2. 常用损失函数2.1 MSE损失函数线性回归中,最常用的就是最小平方误差(MSE)了。MSE也相当简单:MSE的意义相当明确:如果预测值与真实值的欧式距离越大,损失函数越大。欧式距离越小,损失函数越小。同时,求导也是相当容易:其中,θ是模型中待训练的原创 2021-05-08 20:06:04 · 1276 阅读 · 0 评论