自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

原创 SDXL真源码阅读记录(不是调用一下出图就行)

SDXL源码阅读记录

2024-09-20 15:56:44 337

原创 2-1 Open-Sora入门学习(Vae简单了解)

首先,部分内容来自于LLM回答(我主要用GPT4和通义千问),如有错误、不当,希望大家指出并一起讨论学习!VAE 是一种生成模型,它由编码器(encoder)和解码器(decoder)组成。编码器将输入数据映射到潜在空间(latent space),解码器则从潜在空间重建数据。VAE 通过引入概率模型来学习数据的分布。建议参考,对应。

2024-07-25 16:45:42 552 1

原创 1 - Open-Sora入门学习(基于hpcaitech代码)

opensora入门学习

2024-07-03 17:06:54 514

原创 Yolo系列模型使用TensorRT-C++推理学习

回忆了很多c++的基本知识,也对齐了python用TRT推理和c++用TRT的一个流程上的异同,并且在查找很多TRT的c++ api时发现很多api弃用了或者推荐使用新的api,后续计划将该工程对应的api修改换成新版的作为一个课后补习。如有错误,请联系我修改。

2023-12-06 18:47:20 2295 1

原创 目标检测精度计算工具

目标检测精度计算工具

2022-12-09 14:23:52 530 1

原创 pytorch版TTA 源码阅读2

TTA 源码阅读21. Transforms.py主要是图片增强方法的文件首先要提一下的是,它这里transform的类都是继承DualTransform,而这个类又是完全继承上一篇解析过的BaseTransform的class DualTransform(BaseTransform): pass因此看到它直接当做BaseTransform即可其次是ImageOnlyTransform,这个也差不多,只不过子类方法提前写了三个,因为这些transform操作的逆操作是可以直接写的

2021-08-11 17:12:57 471

原创 Pytorch TTA(预测增强) 源码阅读

Pytorch TTA 源码阅读1.ttach/wrappers.pyTTA主要调用的接口继承了pytorch的nn.Moduleimport torchimport torch.nn as nn# 做类型注解的库# 参考 https://www.bilibili.com/read/cv3249320/from typing import Optional, Mapping, Union, Tuple from .base import Merger, Composeclass

2021-08-10 17:33:04 1177

原创 语义分割中label伪彩图或者调色板转换(palette) 基于VOC数据集

voc语义分割数据集介绍网上有很多,可以自己查一查,比如:https://blog.csdn.net/qq_41997920/article/details/104914129常见的图片格式一般为rgb彩色三通道图或者单通道灰度图,但作为语义分割的label图(以voc数据集为例),其png图片实际格式是单通道的彩色图,这里叫伪彩图(或者也叫索引图吧)。由于将图片分割后是把像素点分类,不同类的分割结果用不同颜色表示(此时的类别远远小于平时彩色图里256256256的组合类别),因此我们只需要定义一个类似

2021-06-15 18:17:22 4483

原创 基于深度学习的行人Re-ID问题的综述和展望

基于深度学习的行人Re-ID问题的综述和展望写在前面:写完之后发现git上作者给了一个在知乎发表的官方论文介绍,(官方中文概述)[https://zhuanlan.zhihu.com/p/342249413]我做的稍微详细一点,可以跟官方的对比着看,如有错误请指正。主要概括:关键字:closed-world, open-world本文的主要内容:1)通过讨论现有的深度学习方法的优势和局限性,分析最新技术,我们对现有深度学习方法进行了深入而全面的分析。 这为将来的算法设计和新主题探索提供了见解。2

2021-01-17 22:09:14 1247 1

原创 A Weakly Supervised Convolutional Network for Change Segmentation and Classification(对于变化检测的弱监督卷积网络)

A Weakly Supervised Convolutional Network for Change Segmentation and Classification弱监督学习 参考弱监督学习:监督学习、半监督学习、无监督学习指的是是否有标签,比如监督学习就是已知数据与一一对应的标签,训练算法使其能够将数据映射到标签的过程。半监督是指数据一部分有标签,无监督是数据没有标签,都是通过别的方法(按照一定的偏好:所谓的按照一定的偏好,是比如特征空间距离最近,等人们认为属于一类的事物应具有的一些特点

2020-11-17 19:48:51 698

原创 自步对比学习(Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive Object Re-ID)

自步对比学习(Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive Object Re-ID)简介文章来源目标重识别上面的链接就有很好的介绍,主要怎么理解该问题。个人理解:用简单的大白话来说,该任务的执行过程应该是对于某个目标先进行类似于确定的操作,再在譬如不同摄像机,场景下,再次将该目标识别出来。领域自适应知乎深度学习大讲堂**个人理解:**动机是机器学习深度学习再使用训练样本训练模型之后,测试样本或者

2020-11-02 17:11:33 1022 1

原创 StegaStamp Invisible Hyperlinks in Physical Photographs

隐写邮票:物理照片中不可见的超链接目标,愿景​ 我们的愿景是,在未来,现实世界中的每一张照片都无形地编码了一个指向任意信息的独特超链接。用照相机对着照片就可以获得这些信息,并且通过本文描述的系统去解码和追踪超链接。在未来,增强现实(AR)系统可能会持续执行这项任务,在用户的视图中,可视化地将检索到的信息与每张照片叠加在一起。​ 我们的方法与无处不在的QR码和类似技术有关,这些技术如今已广泛用于各种数据传输任务,例如共享网址,购买商品和跟踪库存。我们的方法可以看作是一种补充解决方案,可以避免可见的,难看

2020-06-03 11:57:26 5699 5

yolov5.zip

用yolov5的四个配置文件,s,l,x,m生成的onnx文件,并且在netron上使用这些文件得到详细的模型配置图,资源包含四个配置文件以及相应的四张图

2020-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除