自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(72)
  • 收藏
  • 关注

原创 Tensorboard入门使用及显示空白/乱码/没有数据的问题

安装后没有下面这样的标红报错就成功啦。

2024-04-25 20:39:52 102

原创 如何在服务器上安装离线安装包

打开以下网址下载mmcv离线安装包。假设你的安装包为mmcv.whl。

2024-03-04 16:39:42 247

原创 三维重建中重投影

将参考点云在源视角下进行投影,然后再回投到参考视角的过程。

2024-01-28 23:52:12 293

原创 Dual-MVSNet/DMVSNet论文精读

本文是Constraining Depth Map Geometry for Multi-View Stereo:A Dual-Depth Approach with Saddle-shaped Depth Cells的阅读记录。

2023-12-13 19:56:37 844

原创 锚框【Anchor frame】

IoU用来计算两个框之间的相似度。NMS可以合并相似的预测。一类目标检测算法是基于。每个锚框预测一个边缘框。

2023-12-04 15:43:31 471

原创 Active Stereo Without Pattern Projector论文精读

主动立体相机和被动立体相机的主要区别在于它们获取立体视觉信息的方式。

2023-12-02 21:23:37 940

原创 目标/物体检测

目标/物体检测:识别图片里的多个物体的类别和位置位置通常用边缘框表示:一个边缘框可以通过4个数字定义。

2023-12-01 16:54:13 509

原创 微调Fine tune

网络架构一个神经网络一般可以分为两块微调:使用之前已经训练好的特征抽取模块来直接使用到现有模型上,而对于线性分类器由于标号可能发生改变而不能直接使用训练是一个目标数据集上的正常训练任务,但使用更强的正则化重用分类器权重固定一些层神经网络通常学习有层次的特征表示微调通过使用在大数据上得到的预训练好的模型来初始化模型权重来完成提升精度预训练模型质量很重要微调通常速度更快,精度更好。

2023-11-30 20:18:45 479

原创 数据增广【以图像增广为例】

数据增广/增强: 对一个已有数据集中的数据进行变换,使其有更多的多样性。数据增广通过通过变形数据来获得多样性从而使得模型的泛化性能更好增强数据一般在线随机生成,主要用在训练过程中。从结果向前推可能会出现的结果,然后对图片进行处理。

2023-11-30 20:05:15 518

原创 多GPU训练的实现

使用多个GPU可以将模型的参数和训练数据分配到不同的GPU上并行处理,从而显著提高训练速度。每个GPU都可以处理一部分数据,同时进行反向传播和参数更新,使得整个训练过程更加高效。: 多GPU训练使得可以处理更大的模型和数据集,因为每个GPU都可以专注于处理部分模型参数和数据。这对于深度学习中复杂模型和大规模数据集的训练非常有益。: 利用多个GPU可以更充分地利用计算资源。在单个GPU上,可能存在计算资源的浪费,而多GPU训练可以更有效地利用这些资源。: 多GPU训练还有助于提高实验迭代速度。

2023-11-20 17:19:32 177

原创 【论文精读3】CasMVSNet

Cascade Cost Volume for High-Resolution Multi-View Stereoand Stereo Matching论文精读

2023-11-18 17:05:11 176

原创 Homography详解&&在MVSNet中的应用

已知一个平面上的两点P和Q,用两台照相机分别对其进行拍摄,那么P、Q会在相机C1上形成投影点p1,q1, 在相机C2上形成投影点p2, q2。再投影回世界坐标下,P 的位置应该不变)在3D坐标下的关系如上图,如果将坐标点投影到相机坐标系下的坐标,就可以得到2D单应性变换,只需要×相机参数K,如下图所示。想知道实际的点P投影到照相机的点的距离D,可以考虑在相机C1前假象n个平面,各个平面到相机的距离分别是d1-dn。已知相机C1距离已知平面的距离d, 相机C1到相机C2的旋转和平移矩阵,已知平面的法向量。

2023-11-16 16:34:53 197

原创 【论文精读2】R-MVSNet

这篇R-MVSNet是Yao Yao等原班人马针对MVSNet在内存消耗上的一个改进,所以基本思想没变,主要是利用不同视角图像特征变换至同一假设深度下,通过差分来判断某特征点属于当前深度的可能性,主要是在差分后代价体正则化步骤用了RNN序列化来做,是用时间换内存空间思想的一种应用。

2023-11-15 16:58:45 484

原创 CL-MVSNet论文精读

本文是对CL-MVSNet: Unsupervised Multi-View Stereo with Dual-Level Contrastive Learning Kaiqiang Xiong, Rui Peng, Zhe Zhang, Tianxing Feng, Jianbo Jiao, Feng Gao, Ronggang Wang的阅读记录原文链接。

2023-11-11 21:12:30 199

原创 算法从入门到入土cpp版

从无序列数组中找有序的第k个数,其实改一下输出就可以了。

2023-11-02 17:37:45 129

原创 CL_MVSNet复现可能会出现的问题汇总

torch.distributed.launch被弃用,考虑使用torchrun模块进行替换。将训练脚本中的torch.distributed.launch替换为torchrun。例如,如果原始命令如下如果还是报错如下:删掉–use-env解决方案:在dataloader时参数shuffle默认False即可。

2023-10-30 21:53:32 329 2

原创 【论文精读1】MVSNet架构各组织详解

提取N个输入图像的深层特征用作深度匹配与传统三维重建方法类似,第一步是提取图像特征(SIFT等特征子),不同点在于本文使用8层的卷积网络从图像当中提取更深层的图像特征表示,网络结构如下图所示:输入:N张3通道的图像,宽高为W,H输出:N组32通道图,每通道尺度为H/4,W/4虽然特征提取后图像帧缩小,但每个剩余像素的原始相邻信息已经被编码到32通道像素描述符中,防止了密集匹配丢失有用的上下文信息。【就是尺寸变小但是通道数增加,不同的通道可以保存更多有用的信息】将提取的特征图和输入图建立一个3D成本体积(之

2023-10-30 01:20:59 286

原创 Anaconda/minAnaconda下配置虚拟环境并安装pytorch相关

安装PyTorch,需要安装pytorch, torchvision,torchaudio三个包。直接看警告的地方提供的最新版本的conda,可以使用以下命令直接更新,但我没解决。Anaconda/minAnaconda下配置虚拟环境并安装pytorch相关。输入 conda list,查看是否存在pytorch 或者torch。输入 torch.cuda.is_available()激活对应的虚拟环境(安装Pytorch的虚拟环境)如果显示为True,就说明Pytorch安装成功了。

2023-10-25 16:58:07 137

原创 一些经典的神经网络(第22天)ending

常见神经网络相关和代码实现

2023-10-18 21:17:11 1629 6

原创 从基础到卷积神经网络(第16天)

从入门到入土

2023-10-13 23:56:18 642

原创 深度学习-房价预测案例

【.fillna(0)对选择的数值型特征进行了填充操作,将缺失值(NaN值)填充为0。fillna()是一个DataFrame对象的方法,用于填充缺失值】【torch.clamp()函数会将输出结果中小于下界的值替换为下界,将大于上界的值替换为上界,因此它可以用来对输出结果进行范围限制】【使用iloc属性对train_data这个DataFrame对象进行切片操作,选取了指定行和列的数据子集】.reshape(-1, 1)改变数组的形状,将其变为一个列向量(具有一列)。

2023-10-11 21:31:27 258

原创 Jupyter 报错:can‘t convert np.ndarray of type numpy.object_.

解决方案:使用.astype(“float64”)强制转化。

2023-09-24 00:43:21 400

原创 [winerror 5] 拒绝访问。: ‘..\\data‘解决方案

使用Jupyter Notebook学习深度学习时出现错误如下:[winerror 5] 拒绝访问。点编辑,选择User,勾选如下图所示权限,选择应用,然后确定。打开anaconda3找到python.exe。

2023-09-23 22:25:42 1249

原创 深度学习从入门到基础(第11天结束)

N维数组样例N维数组是机器学习和神经网络的主要数据结构0-d一个类别: 1.01-d一个特征向量(一维矩阵):[1.0, 2.7, 3.4]2-d一个样本-特征矩阵-(二维矩阵)3-dRGB图片 (宽x高x通道)- 三维数组4-d一个RGB图片批量(批量大小x宽x高x通道)5-d一个视频批量(批量大小x时间x宽x高x通道)访问元素。

2023-09-22 22:30:22 471

原创 安装Jupyter可能会出现的问题

安装Jupyter可能会出现的问题。

2023-09-22 18:00:33 334

原创 优化器的使用

造成损失参数不降反升,是lr设置过大。结果示例:每轮的损失参数不断减小。调整lr=0.001。

2023-09-16 17:34:46 287

原创 神经网络入门(完结版)

神经网络的基本骨架。

2023-09-01 22:54:52 503

原创 DataLoader的使用

设置drop_last=False 结果,最后一步不足64张任然进行了保留。最后一步不足64张进行了舍去,所以只有155步。设置drop_last=True后。

2023-08-31 19:52:26 500

原创 torchvision中数据集的使用

第一步:下载数据集到本地,可以下载到同路径目录下(非常慢,可以直接复制链接(不显示路径可以ctrl进源代码查看,一般都会有)进迅雷下载,下载好将其复制到同名目录下运行过程中会自动解压)查看数据集中的数据,可以添加断点查看。在tensorboard中显示图片。

2023-08-31 00:49:10 200

原创 Transforms的使用

transforms主要是对图片进行变换。

2023-08-28 22:10:17 185

原创 TensorBoard的使用

TensorBoard:对图像进行变换。

2023-08-28 00:26:08 301

原创 Dataset类实践

Dataset类实践蚂蚁蜜蜂分类数据集和下载链接https://download.pytorch.org/tutorial/hymenoptera_data.zipDataset:提供一种方式去获取数据及其lableQ:如何获取每个数据及其lable重写构造方法和获取标签方法Q:告诉我们总共有多少数据重写len方法在控制台中进行测试。

2023-08-26 16:43:10 178

原创 STL案例一:评委打分

STL案例一:评委打分案例描述:选手ABCDE,10名评委分别为每一名选手打分,去除最高分,去除最低分,取平均分。

2023-07-15 13:21:31 153

原创 STL(标准模板库)的使用

STL(标准模板库)的使用

2023-06-19 22:24:39 515

原创 类模板案例_数组类封装

【代码】类模板案例_数组类封装。

2023-06-19 00:25:13 65

原创 C++泛型编程-模板

C++泛型编程-模板

2023-06-19 00:23:41 107

原创 基于多态的职工管理系统

基于多态的职工管理系统,可以用来管理公司内所有员工的信息。

2023-06-16 21:57:29 120

原创 通讯录管理系统(C++)

C++实现通讯录管理系统

2023-05-28 15:52:29 97 1

原创 C++从入门到入土(入土第15天)

C++基础语法;C++面向对象编程

2023-05-25 01:15:22 581

原创 python人脸识别

人脸识别(未完成)最后训练出现问题,未解决。

2023-05-18 21:30:52 185

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除