mvcnn代码详解_MV-CRNN: Learning Multi-view Representation with LSTM for 3D Shape Recognition and Retriev...

这是一个关于MV-CRNN的实现,它使用PyTorch 0.3,包括训练和测试代码,以及网络模型如CNN1,CNN2,EncoderCNN和DecoderRNN。代码涉及数据预处理、模型训练、CNN预训练和多视图表示学习,用于3D形状识别和检索任务。
摘要由CSDN通过智能技术生成

#MV-CRNN

pytorch version: 0.3

代码和文件夹说明

代码

未列入的代码文件为旧代码,已不再使用。

train_main.py

训练代码

train_test.py

测试代码。

configuration.py

基本配置代码,包括超参、数据路径、模型等

model.py

定义网络模型,包括CNN1,CNN2, EncoderCNN, DecoderRNN等

train_CNN.py

对CNN1,CNN2进行预训练的代码

get_dataset.py

生成数据集与加载数据集的代码,用于训练与测试的数据加载

datasetSV.py

用于进行CNN预训练的单视角实验训练与测试,生成数据集与加载数据集的代码。

与get_dataset.py共用数据来源。数据路径在configuration.py中设置,数据的来源由matlab代码对off数据进行render得到。

metrics_logging.py、train_reports.py

格式化记录训练过程并可以在训练中查看训练情况。该代码来源于VoxNet项目。

plot_confusion_matrix.py

用于绘制confusion matrix图,主要针对ModelNet10

script_analysis.py

实验过程中的一些小测试

文件夹

data_preprocess文件夹

用于数据集的预处理。由off格式经过render得到各个视角的图像,并以mat格式进行存储。每个mat存储一个shape得到的所有view图像,格式为(view_NO,channel,height,width).

主函数为demo.m,可在代码中设置view的数目,是否进行旋转等设置。

Script_copeData.m 用于一键清理历史数据。使用时谨慎!!!

doc

文档。主要是论文。暂未开始。

checkpoints

训练过程中保存的网络模型参数。后续通过main_test.py从中选出测试精度最高的一组模型参数

pretrained_models

预训练的各种网络参数。包括cnn预训练参数,分步训练过程中的网络参数等

ref

参考内容

results

测试保存的结果

sc

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: crnn_lite_lstm_bk.onnx 是一个深度学习模型文件,以 ONNX 格式存储。ONNX 是一个开放的神经网络交换格式,可以在不同的深度学习框架之间进行模型的转换和共享。 这个模型是一个轻量级的CRNN(卷积循环神经网络)模型,用于文本识别任务。CRNN 是一种结合了卷积神经网络(CNN)和循环神经网络(RNN)的模型,能够同时处理图像和序列数据,适合于需要从图像中提取文本信息的应用领域。 模型的主要结构包括卷积层、循环层和全连接层。卷积层用于提取图像的特征,循环层用于处理时间序列数据,全连接层用于将提取的特征映射到具体的文本分类或识别结果。此外,模型还使用了LSTM(长短期记忆)单元,用于捕捉序列数据中的长程依赖关系。 使用这个模型,可以将输入的图像数据传入模型中,经过前向推理过程,得到对应的文本识别结果。模型训练时需要一定的标注数据,包含输入图像以及对应的文本标签。可以使用现有的深度学习框架加载并运行这个模型,提供输入图像后,即可完成文本识别任务。 总之,crnn_lite_lstm_bk.onnx 是一个用于文本识别的轻量级CRNN模型,采用ONNX格式进行存储,可以方便地应用于不同的深度学习框架中,用于图像文本识别等相关任务。 ### 回答2: crnn_lite_lstm_bk.onnx是一个基于ONNX格式的神经网络模型文件。CRNN代表了卷积循环神经网络,在图像处理和文字识别领域非常有用。CRNN模型结合了卷积神经网络和循环神经网络,可以对包含文字的图像进行识别和理解。 在文字识别任务中,crnn_lite_lstm_bk.onnx模型可以通过输入一张包含文字的图像,输出对文字的识别结果。模型通过多层卷积神经网络来提取图像的特征信息,并通过LSTM(长短期记忆神经网络)对这些特征进行序列建模,最后使用全连接层输出对文字的分类结果。 crnn_lite_lstm_bk.onnx模型是一个精简版本的CRNN模型,特点是模型体积较小,适合在资源受限的设备上运行。模型通过降低网络的深度和参数量,以及采用轻量级的LSTM模块,实现了模型体积的降低。这使得模型在嵌入式设备或移动设备上能够高效地运行,并且能够处理实时的文字识别任务。 总之,crnn_lite_lstm_bk.onnx是一个基于ONNX格式的文字识别模型,结合了卷积神经网络和循环神经网络,适用于在资源受限的设备上进行实时文字识别任务。它的精简版本设计使其在嵌入式设备或移动设备上具备高效运行的能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值