深度学习笔记
文章平均质量分 73
分享在深度学习过程中遇到的知识点,也会更新自己的学习笔记。
旅途中的宽~
计算机视觉在读研究生,第二十届华为杯研究生数学建模国一(第6名),获Kaggle计算机视觉竞赛Stable Diffusion银牌(top3%,37名),Identify Contrails银牌(top5%,45名),UBC-OCEAN铜牌(top7%,86名),kaggle expert,CSDN人工智能领域优质创作者,阿里云博客专家。方向是目标检测,对CV和NLP都有兴趣,主流工具为Python,其他时间在攻读C++,算法,SQL,Git,Docker,SSH等。希望和大家一起交流学习!
展开
-
【深度学习】Kaggle知识点:Pytorch基类 nn.Module(含代码)
【深度学习】Kaggle知识点:Pytorch基类 nn.Module原创 2024-01-18 10:02:11 · 1161 阅读 · 0 评论 -
【机器学习】干货:计算两个向量之间相似性的方法(含源代码)
【机器学习】干货:计算两个向量之间相似性的方法(含源代码)原创 2023-09-13 16:40:11 · 5880 阅读 · 0 评论 -
【torch】如何把把几个 tensor 连接起来?(含源代码)
【torch】如何把把几个 tensor 连接起来?(含源代码)原创 2023-09-06 13:39:51 · 1390 阅读 · 0 评论 -
【深度学习】神经网络中 Batch 和 Epoch 之间的区别是什么?我们该如何理解?
【深度学习】神经网络中 Batch 和 Epoch 之间的区别是什么?我们该如何理解?原创 2023-08-29 10:50:10 · 3287 阅读 · 0 评论 -
【深度学习 | 计算机视觉】Focal Loss原理及其实践(含源代码)
【深度学习 | 计算机视觉】Focal Loss原理及其实践(含源代码)原创 2023-07-15 11:04:31 · 2322 阅读 · 0 评论 -
【深度学习】最全的十九种损失函数汇总
【深度学习】最全的十九种损失函数汇总原创 2023-06-27 10:09:30 · 6340 阅读 · 0 评论 -
【跑实验04】CLIP安装报错,setup.py如何安装,图像编码器(image_encoder)的使用(含源代码)
【跑实验04】CLIP安装报错,setup.py如何安装,图像编码器(image_encoder)的使用(含源代码)原创 2023-06-23 10:49:34 · 3145 阅读 · 0 评论 -
【计算机视觉】在计算机视觉里,传统卷积已经彻底输给Transformer了吗?
【计算机视觉】在计算机视觉里,传统卷积已经彻底输给Transformer了吗?原创 2023-06-23 09:14:55 · 1738 阅读 · 0 评论 -
【深度学习】近万字解读深度学习领域有哪些瓶颈?
【深度学习】近万字解读深度学习领域有哪些瓶颈?原创 2023-06-21 14:08:26 · 840 阅读 · 0 评论 -
【计算机视觉】CVPR 2023 上的分割论文真的是神仙打架(介绍前12篇,图像分割,全景分割,语义分割,实例分割)
【计算机视觉】CVPR 2023 上的分割论文真的是神仙打架(介绍前12篇,图像分割,全景分割,语义分割,实例分割)原创 2023-06-21 13:46:50 · 16343 阅读 · 3 评论 -
【计算机视觉】计算机视觉的简单入门代码介绍(含源代码)
【计算机视觉】计算机视觉的简单入门代码介绍(含源代码)原创 2023-06-21 10:28:58 · 1716 阅读 · 0 评论 -
【深度学习 | 机器学习】干货满满 | 近万字总结了 12 个令人惊艳的神经网络可视化工具!
【深度学习 | 机器学习】干货满满 | 近万字总结了 12 个令人惊艳的神经网络可视化工具!原创 2023-06-20 21:08:22 · 2983 阅读 · 0 评论 -
【机器学习 | 深度学习】Colab是什么?以及如何使用它?
【机器学习 | 深度学习】Colab是什么?以及如何使用它?原创 2023-06-08 15:37:12 · 14891 阅读 · 0 评论 -
【计算机视觉 | 目标检测】术语理解3:Precision、Recall、F1-score、mAP、IoU 和 AP
【计算机视觉 | 目标检测】术语理解3:Precision、Recall、F1-score、mAP、IoU 和 AP原创 2023-05-19 14:32:16 · 6051 阅读 · 0 评论 -
【计算机视觉】最后显示的CIFAR-100数据集照片很模糊怎么解决?
【计算机视觉】最后显示的CIFAR-100数据集照片很模糊怎么解决?原创 2023-05-18 10:36:31 · 1407 阅读 · 0 评论 -
【计算机视觉】CLIP实战:Zero-Shot Prediction(含源代码)
【计算机视觉】CLIP实战:Zero-Shot Prediction(含源代码)原创 2023-05-18 10:19:47 · 2171 阅读 · 1 评论 -
【计算机视觉 | 目标检测】术语理解2:Grounding 任务、MLM、ITM代理任务
【计算机视觉 | 目标检测】术语理解2:Grounding 任务、MLM、ITM代理任务原创 2023-05-16 15:07:44 · 5161 阅读 · 4 评论 -
【计算机视觉 | 目标检测】术语理解:V2L 映射、视觉 embedding 和文本 embedding
【计算机视觉 | 目标检测】术语理解:V2L 映射、视觉 embedding 和文本 embedding原创 2023-05-16 14:01:56 · 1017 阅读 · 0 评论 -
【计算机视觉】如何利用 CLIP 做简单的人脸任务?(含源代码)
【计算机视觉】如何利用 CLIP 做简单的人脸任务?(含源代码)原创 2023-05-15 16:09:48 · 2402 阅读 · 3 评论 -
【深度学习 | torchvision】当使用 torchvision.datasets 加载数据集时,如何获取路径?
【深度学习 | torchvision】当使用 torchvision.datasets 加载数据集时,如何获取路径?原创 2023-05-15 14:45:00 · 616 阅读 · 0 评论 -
【计算机视觉】如何利用 CLIP 做简单的图像分类任务?(含源代码)
【计算机视觉】如何利用 CLIP 做简单的图像分类任务?(含源代码)原创 2023-05-15 11:12:16 · 5238 阅读 · 0 评论 -
【计算机视觉 | 自然语言处理】Hugging Face 超详细介绍和使用教程
【计算机视觉 | 自然语言处理】Hugging Face 超详细介绍和使用教程原创 2023-05-14 17:11:49 · 10229 阅读 · 0 评论 -
【Python | 深度学习】safetensors 包的介绍和使用案例(含源代码)
【Python | 深度学习】safetensors 包的介绍和使用案例(含源代码)原创 2023-05-14 15:20:46 · 19642 阅读 · 5 评论 -
【计算机视觉 | Pytorch】timm 包的具体介绍和图像分类案例(含源代码)
【计算机视觉 | Pytorch】timm 包的具体介绍和图像分类案例(含源代码)原创 2023-05-14 12:04:17 · 5681 阅读 · 6 评论 -
【深度学习 | Python】AutoModel, AutoProcessor的介绍
【深度学习 | Python】AutoModel, AutoProcessor的介绍原创 2023-05-12 20:33:38 · 2298 阅读 · 0 评论 -
【自然语言处理 | BERT】BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding论文讲解
【自然语言处理 | BERT】BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding论文讲解原创 2023-05-04 21:00:41 · 1248 阅读 · 1 评论 -
【人工智能 | 计算机视觉】Google Research, 2022 & beyond: Language, vision and generative models
【人工智能 | 计算机视觉】Google Research, 2022 & beyond: Language, vision and generative models原创 2023-05-04 15:27:47 · 306 阅读 · 0 评论 -
【深度学习 | PPT分享】一文看懂注意力机制
【深度学习 | PPT分享】一文看懂注意力机制原创 2023-05-04 14:57:34 · 474 阅读 · 0 评论 -
【人工智能 | 多模态】几种常见的多模态任务
【人工智能 | 多模态】几种常见的多模态任务原创 2023-05-03 15:51:52 · 4892 阅读 · 0 评论 -
【ChatGPT】如何让 ChatGPT 不再频繁报错,获取更加稳定的体验?
【ChatGPT】如何让 ChatGPT 不再频繁报错,获取更加稳定的体验?原创 2023-04-25 13:28:53 · 4284 阅读 · 0 评论 -
【自然语言处理 | NLP】“token“, “embedding“,“encoding“各自的区别分别是什么?
【自然语言处理 | NLP】"token", "embedding","encoding"各自的区别分别是什么?原创 2023-04-22 10:52:34 · 10220 阅读 · 0 评论 -
【深度学习 | Pytorch】从MNIST数据集看batch_size
【深度学习 | Pytorch】从MNIST数据集看batch_size原创 2023-04-06 09:11:54 · 1462 阅读 · 0 评论 -
SOTA该如何理解?
SOTA该如何理解?原创 2023-03-16 15:42:52 · 1983 阅读 · 0 评论 -
【目标检测】目标检测中的标签分配
文章目录一、前言二、标签分配方法的分类2.1 标签是否非负2.2 是否有预测结果参与一、前言在目标检测任务中,标签分配起着关键的作用,其目的是将样本划分成正样本和负样本,然后与GT之间计算loss,决定模型如何学习和收敛。二、标签分配方法的分类2.1 标签是否非负标分配策略,是一个预定义的规则,能够分配每个anchor的正负,也就是一个gt会对应多个anchor。 常用的label assignment是Max IOU Assign,具体流程:首先,对于GT box(NNN个)和anchor(原创 2023-03-15 10:27:05 · 1474 阅读 · 0 评论 -
【计算机视觉】CNN 可视化算法
【计算机视觉】CNN 可视化算法原创 2023-03-13 10:36:03 · 1485 阅读 · 0 评论 -
【深度学习】什么是解耦?
【深度学习】什么是解耦?原创 2023-03-10 18:51:20 · 2952 阅读 · 0 评论 -
【计算机视觉】Zero-shot, One-shot和Few-shot的理解
【计算机视觉】Zero-shot, One-shot和Few-shot的理解原创 2023-03-09 14:54:55 · 10736 阅读 · 3 评论 -
【计算机视觉 & 自然语言处理】什么是多模态?
【计算机视觉 & 自然语言处理】什么是多模态?原创 2023-03-08 09:01:09 · 3612 阅读 · 0 评论 -
【计算机视觉】Visual grounding系列
【计算机视觉】Visual grounding系列原创 2023-03-07 18:29:11 · 3653 阅读 · 1 评论 -
【计算机视觉】上游任务和下游任务的理解
【计算机视觉】上游任务和下游任务的理解原创 2023-03-07 09:56:19 · 3184 阅读 · 0 评论