自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 分割任务中常见的损失计算方式以及预测值(pred)和目标值(target)的形状

总结常见分割损失

2024-02-27 11:44:46 951

原创 离散余弦变换(DCT)与 量化表 与 块伪影网络(RAG)

例如,在频域表示中,我们可以看到哪些频率成分对图像的主要结构和特征贡献最大,或者在信号处理中,我们可以观察到信号中的周期性和频率成分。在空域表示中,图像或信号是通过其在空间上的像素或采样点的强度或振幅来描述的。在相机和智能手机数字设备中,图像采集的过程涉及多个步骤,其中之一是通过对图像的DCT(离散余弦变换)系数进行量化,对图像进行修补和压缩。因此,空域转换为频域是一种将图像或信号从在空间上的表示转换为在频率上的表示的过程,通过这种转换可以获得信号或图像在不同频率上的信息和特征。

2024-02-21 17:25:33 546

原创 3d Gaussian splatting笔记及讨论

最近学习了3D gaussian splattoing的一些知识,也了解了一些Nerf的相关知识。之前一直做2d多模态的相关知识,对于3d处于刚刚接触的阶段,想着以新手的视角记录一下学习过程,一来加深自己的理解,二来想与各位讨论求教。由于水平实在有限,本篇文章就讲究一个浅尝辄止,如果这些笔记有幸能够启发到各位那就再好不过了。很长,大家慢慢看,有参考链接还是得看人家写的博客,比我的详细多了。

2024-01-31 14:49:09 1189

原创 Python中Refistered作用的理解

Rester机制笔记

2023-02-24 14:08:07 89

原创 window下使用lmdb内存过大的bug

lmdb.Error: lmdb/refcoco\testB.lmdb: ���̿ռ䲻�㡣

2022-11-28 23:35:28 929 3

原创 clip预训练好的模型下载地址,github上扒的

clip预训练文件下载地址

2022-09-28 14:58:54 4074 8

原创 LBDT从多卡到单卡遇到AssertionError: Default process group is not initialized

分布式训练就变成单卡

2022-06-23 10:57:28 291

原创 Opencv保存的视频无法播放

cap = cv.VideoCapture(videoFile) print(cap.get(cv.CAP_PROP_FRAME_WIDTH)) print(cap.get(cv.CAP_PROP_FRAME_HEIGHT)) # 重新定义视频大小,并将其保存到指定路径中 fourcc = cv.VideoWriter_fourcc(*'XVID') videoFile = os.path.join("..\\demoDatasets\\videos4", "te..

2021-08-13 20:52:57 1328

原创 2021-08-05

训练模型报错cuda-runtime-error-59-device-side-assert-triggered百度答案是tensor不匹配检擦代码后发现是因为数据集lablel类型大于模型中设置好的分类类型

2021-08-05 23:39:46 64

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除