- 博客(75)
- 收藏
- 关注
原创 MVSNet的一点点总结和思考
输入 (3,N,H,W),输出(32,N,H/4,W/4)【N是指N张图】。进行下采样是考虑到显存不够使,现在的工作一般不进行下采样的了本文主要提出CNN来得到更好的特征,深入思考一下是否有更好的方法来进行特征提取?用transformer?有人做过了,所以说有想法不行,还要手快才行。
2024-05-05 23:29:55 221
原创 基于深度学习的MVS学习笔记(05.04-05.07)
针对MVS专门拍摄处理的高精度室内物体数据集,利用可调节照明的ABB机械臂进行多视点拍摄由124个不同场景组成每个物体共拍摄49个不同的视角每个视角共有7种不同的亮度每张图像分辨率为1600x1200准确率召回率/完整性。
2024-05-05 22:01:40 944
原创 Dual-MVSNet/DMVSNet论文精读
本文是Constraining Depth Map Geometry for Multi-View Stereo:A Dual-Depth Approach with Saddle-shaped Depth Cells的阅读记录。
2023-12-13 19:56:37 880
原创 Active Stereo Without Pattern Projector论文精读
主动立体相机和被动立体相机的主要区别在于它们获取立体视觉信息的方式。
2023-12-02 21:23:37 990
原创 微调Fine tune
网络架构一个神经网络一般可以分为两块微调:使用之前已经训练好的特征抽取模块来直接使用到现有模型上,而对于线性分类器由于标号可能发生改变而不能直接使用训练是一个目标数据集上的正常训练任务,但使用更强的正则化重用分类器权重固定一些层神经网络通常学习有层次的特征表示微调通过使用在大数据上得到的预训练好的模型来初始化模型权重来完成提升精度预训练模型质量很重要微调通常速度更快,精度更好。
2023-11-30 20:18:45 505
原创 数据增广【以图像增广为例】
数据增广/增强: 对一个已有数据集中的数据进行变换,使其有更多的多样性。数据增广通过通过变形数据来获得多样性从而使得模型的泛化性能更好增强数据一般在线随机生成,主要用在训练过程中。从结果向前推可能会出现的结果,然后对图片进行处理。
2023-11-30 20:05:15 575
原创 多GPU训练的实现
使用多个GPU可以将模型的参数和训练数据分配到不同的GPU上并行处理,从而显著提高训练速度。每个GPU都可以处理一部分数据,同时进行反向传播和参数更新,使得整个训练过程更加高效。: 多GPU训练使得可以处理更大的模型和数据集,因为每个GPU都可以专注于处理部分模型参数和数据。这对于深度学习中复杂模型和大规模数据集的训练非常有益。: 利用多个GPU可以更充分地利用计算资源。在单个GPU上,可能存在计算资源的浪费,而多GPU训练可以更有效地利用这些资源。: 多GPU训练还有助于提高实验迭代速度。
2023-11-20 17:19:32 308
原创 【论文精读3】CasMVSNet
Cascade Cost Volume for High-Resolution Multi-View Stereoand Stereo Matching论文精读
2023-11-18 17:05:11 317
原创 Homography详解&&在MVSNet中的应用
已知一个平面上的两点P和Q,用两台照相机分别对其进行拍摄,那么P、Q会在相机C1上形成投影点p1,q1, 在相机C2上形成投影点p2, q2。再投影回世界坐标下,P 的位置应该不变)在3D坐标下的关系如上图,如果将坐标点投影到相机坐标系下的坐标,就可以得到2D单应性变换,只需要×相机参数K,如下图所示。想知道实际的点P投影到照相机的点的距离D,可以考虑在相机C1前假象n个平面,各个平面到相机的距离分别是d1-dn。已知相机C1距离已知平面的距离d, 相机C1到相机C2的旋转和平移矩阵,已知平面的法向量。
2023-11-16 16:34:53 331
原创 【论文精读2】R-MVSNet
这篇R-MVSNet是Yao Yao等原班人马针对MVSNet在内存消耗上的一个改进,所以基本思想没变,主要是利用不同视角图像特征变换至同一假设深度下,通过差分来判断某特征点属于当前深度的可能性,主要是在差分后代价体正则化步骤用了RNN序列化来做,是用时间换内存空间思想的一种应用。
2023-11-15 16:58:45 604
原创 CL-MVSNet论文精读
本文是对CL-MVSNet: Unsupervised Multi-View Stereo with Dual-Level Contrastive Learning Kaiqiang Xiong, Rui Peng, Zhe Zhang, Tianxing Feng, Jianbo Jiao, Feng Gao, Ronggang Wang的阅读记录原文链接。
2023-11-11 21:12:30 322
原创 CL_MVSNet复现可能会出现的问题汇总
torch.distributed.launch被弃用,考虑使用torchrun模块进行替换。将训练脚本中的torch.distributed.launch替换为torchrun。例如,如果原始命令如下如果还是报错如下:删掉–use-env解决方案:在dataloader时参数shuffle默认False即可。
2023-10-30 21:53:32 505 3
原创 【论文精读1】MVSNet架构各组织详解
提取N个输入图像的深层特征用作深度匹配与传统三维重建方法类似,第一步是提取图像特征(SIFT等特征子),不同点在于本文使用8层的卷积网络从图像当中提取更深层的图像特征表示,网络结构如下图所示:输入:N张3通道的图像,宽高为W,H输出:N组32通道图,每通道尺度为H/4,W/4虽然特征提取后图像帧缩小,但每个剩余像素的原始相邻信息已经被编码到32通道像素描述符中,防止了密集匹配丢失有用的上下文信息。【就是尺寸变小但是通道数增加,不同的通道可以保存更多有用的信息】将提取的特征图和输入图建立一个3D成本体积(之
2023-10-30 01:20:59 615
原创 Anaconda/minAnaconda下配置虚拟环境并安装pytorch相关
安装PyTorch,需要安装pytorch, torchvision,torchaudio三个包。直接看警告的地方提供的最新版本的conda,可以使用以下命令直接更新,但我没解决。Anaconda/minAnaconda下配置虚拟环境并安装pytorch相关。输入 conda list,查看是否存在pytorch 或者torch。输入 torch.cuda.is_available()激活对应的虚拟环境(安装Pytorch的虚拟环境)如果显示为True,就说明Pytorch安装成功了。
2023-10-25 16:58:07 190
原创 深度学习-房价预测案例
【.fillna(0)对选择的数值型特征进行了填充操作,将缺失值(NaN值)填充为0。fillna()是一个DataFrame对象的方法,用于填充缺失值】【torch.clamp()函数会将输出结果中小于下界的值替换为下界,将大于上界的值替换为上界,因此它可以用来对输出结果进行范围限制】【使用iloc属性对train_data这个DataFrame对象进行切片操作,选取了指定行和列的数据子集】.reshape(-1, 1)改变数组的形状,将其变为一个列向量(具有一列)。
2023-10-11 21:31:27 301
原创 Jupyter 报错:can‘t convert np.ndarray of type numpy.object_.
解决方案:使用.astype(“float64”)强制转化。
2023-09-24 00:43:21 633
原创 [winerror 5] 拒绝访问。: ‘..\\data‘解决方案
使用Jupyter Notebook学习深度学习时出现错误如下:[winerror 5] 拒绝访问。点编辑,选择User,勾选如下图所示权限,选择应用,然后确定。打开anaconda3找到python.exe。
2023-09-23 22:25:42 1968 1
原创 深度学习从入门到基础(第11天结束)
N维数组样例N维数组是机器学习和神经网络的主要数据结构0-d一个类别: 1.01-d一个特征向量(一维矩阵):[1.0, 2.7, 3.4]2-d一个样本-特征矩阵-(二维矩阵)3-dRGB图片 (宽x高x通道)- 三维数组4-d一个RGB图片批量(批量大小x宽x高x通道)5-d一个视频批量(批量大小x时间x宽x高x通道)访问元素。
2023-09-22 22:30:22 506
原创 DataLoader的使用
设置drop_last=False 结果,最后一步不足64张任然进行了保留。最后一步不足64张进行了舍去,所以只有155步。设置drop_last=True后。
2023-08-31 19:52:26 537
原创 torchvision中数据集的使用
第一步:下载数据集到本地,可以下载到同路径目录下(非常慢,可以直接复制链接(不显示路径可以ctrl进源代码查看,一般都会有)进迅雷下载,下载好将其复制到同名目录下运行过程中会自动解压)查看数据集中的数据,可以添加断点查看。在tensorboard中显示图片。
2023-08-31 00:49:10 261
原创 Dataset类实践
Dataset类实践蚂蚁蜜蜂分类数据集和下载链接https://download.pytorch.org/tutorial/hymenoptera_data.zipDataset:提供一种方式去获取数据及其lableQ:如何获取每个数据及其lable重写构造方法和获取标签方法Q:告诉我们总共有多少数据重写len方法在控制台中进行测试。
2023-08-26 16:43:10 217
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人