![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
杂七杂八
文章平均质量分 63
杂七杂八,零零散散
じんじん
这个作者很懒,什么都没留下…
展开
-
Frustum PointNets for 3D Object Detection from RGB-D Data(2018)
② 3D Instance Segmentation 后,属于物体的点就可以提取出来(mask)① 给定摄像机投影矩阵,2D边框可以被提升到椎体,这个椎体定义了物体的3D搜索空间。① 输入椎体内的点云,预测每个点属于该物体的分数,一个椎体只含有一个感兴趣的物体。③ 旋转椎体,使椎体的中心轴正交于成像平面,可以提高算法的旋转不变性。点云转化成图片或一定分辨率的立体网格,再把2D卷积泛化到3D卷积。但是物体在空间中是分开的,所以在3D点云中分割是自然且相对容易。③ 进一步标准化物体点的坐标,提高平移不变性。原创 2024-03-14 20:01:40 · 576 阅读 · 1 评论 -
Pretrain-finetune、Prompting、Instruct-tuning训练方法的区别
原创 2024-03-14 19:49:38 · 1271 阅读 · 0 评论 -
扩散概率模型(1)
加噪声多了就变成了一个已经看不清原始图片的一个图片,继续加,就认为最后得到的是一个服从标准高斯分布的一个图片,即白噪声,即我就可以认为最后的这个白噪声就是我随机挑的点,因为我随机挑的点就是白噪声,两者等价。假如,我前向过程,也就是加噪声的过程用了T步,也就是加了T次噪声,那我后向过程(也就是从噪声生成图片的过程)神经网络也得学习T步,学习到每一步加的什么噪声,然后我挑的那个随机点一步步减去这个学习到的噪声,最终经过T步相减后,就得到了一张图片。到这,上面损失函数公式中的比较都是在高斯分布之间比较的。原创 2024-03-13 15:15:55 · 704 阅读 · 0 评论 -
MAE预训练的VIT
原创 2024-03-13 15:14:45 · 238 阅读 · 0 评论 -
SEnet实战 -- 垃圾分类
有一个文件夹data,下面一个train文件夹,再下面有6个子文件夹,文件夹名称分别是每种垃圾图片的类别,每个类别下面有该类垃圾的图片。数据预处理过程比较简单,只进行了大小的调整,全部缩放到224x224。采用SEnet网络训练进行分类,加注意力机制后准确率会稍高一些。(还可以增加的常规的数据增强操作,如翻转、裁剪等)SEnet:resnet18+通道域注意力。SE层结构如下,暂时不讲注意力机制。训练文件train.py代码如下。训练集占70%,测试集占30%原创 2020-04-26 18:13:45 · 1230 阅读 · 4 评论 -
opencv-python实战
opencv-python实战1、信用卡数字识别这个项目网上代码比较多,稍稍整理了一下,理了理顺序,如下:import cv2import numpy as np# 指定信用卡类型first_number = { "3": "American Express", "4": "Visa", "5": "MasterCard", "6": "Discove...转载 2020-03-24 20:35:25 · 310 阅读 · 0 评论 -
GCN -- 随手记
普通卷积:图卷积拉普拉斯矩阵:(1)空域(spatial domain)卷积简单说就是提取拓扑图上的空间特征,然后把每个顶点相邻的节点(邻域)找出来,我把你拼成规则的数据结构,然后进行卷积[2]。具体的操作方法包含三个步骤:1.从图中选择一个固定长度的节点序列;2.对序列中的每个节点,收集固定大小的邻域集合;3.对由当前节点及其对应的邻域构成的子图进行规范化,作为卷积结构的输入,后面就是传统神经网络的常规操作了。(2) 频域(spectral domain)卷积.原创 2020-06-02 08:47:00 · 296 阅读 · 0 评论