自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 计算点到线的横向距离

【代码】计算点到线的横向距离。

2024-04-18 15:23:44 210

原创 Argoverse2 数据集分析

Argoverse2 数据集分析

2023-12-18 15:49:03 1487 1

原创 QCNet 可视化

QCNet轨迹可视化,只要是Argoverse2 都可以用该代码进行可视化

2023-12-13 16:13:44 1229 3

原创 RT1复现(四)

将一个块推到另一个块的相对偏移位置:左侧、右侧、顶部、底部、左上侧、右上侧、左下侧、右下侧。有448个唯一的任务条件(8个源块x7个目标块x8个偏移方向)。将一个块推到板上的绝对位置:左上角、中上、右上角、左中、中心、右中、左下角、中下、右下角。这部分工作是测试部分,language-table测试有5个任务,测试过程随机生成颜色形状块,然后生成相对应的指令,每个任务有对应的成功标准,比如多少m之内就算成功。将一个块推到相对偏移的位置:左、右、上、下、左上、右上、左下、右下。成功是两个块之间的阈值距离。

2023-11-16 20:39:17 355

原创 RT1复现(三)

先将language_table_sim-train.tfrecor-0000格式变成episode_0.npy格式,可以不用划分验证集和测试集。这部分的工作是对language部分进行特征提取,使用rt1文章的Universal Sentence Encoder的模型进行数据预处理。

2023-11-16 20:22:37 395 1

原创 RT1复现(二)

而且也没有公开测试部分的代码和仿真环境,我们采用language_table数据集进行RT1的复现,因为该数据集开源且有仿真环境,可以对RT1模型输出的action进行一个测试。RT1目前只公开了模型的代码,缺少dataloader和train部分的代码。

2023-11-16 20:09:47 676 1

原创 RT1复现(一)

robotics_transformer

2023-10-13 19:17:54 605 5

原创 EfficientNet V2

Fused-MBConv 根据expansion是否等于1 有2种。针对3:对每个stage采用非均匀的缩放策略来缩放模型。针对2:引入Fused-MBConv。针对1:降低图像尺寸。注意区分MBConv。

2023-07-10 23:33:50 67

原创 EfficientNet V1

这篇文章的创新点主要是讨论了图像输入的分辨率,网络的深度(网络层数)和宽度(网络通道数)的影响。用的MBConv就是MobileNetV3的block。

2023-07-10 22:33:06 59

原创 ShuffleNet

给我的感觉有点像self-attention。相比于v1 重新修改了网络结构。

2023-07-09 23:19:43 59

原创 MobileNet v3

不改变通道数,先进行一个自适应平均池化,fc1先降维将通道数变成输入的1/4,然后fc2在升维变成输入的通道。1.相比于v2 主要是在Block 模块加入了注意力模块。2.激活函数从ReLU6 变成了Hardswish。

2023-07-09 16:24:25 52

原创 MobileNet v2

2.从高维空间经过relu映射回二维空间,信息损失较少,从低维空间映射回二维空间,信息损失较多。则可认为,在低维空间使用relu会损失较多信息,所以作者在倒残差结构的降维操作时,使用线性激活。1.为了解决v1 DW卷积的卷积核大部分为0,也就是其卷积核没有发挥提取特征作用。那么先通过1*1卷积将维度上升,再使用深度卷积,深度卷积的输入输出通道数更高,就能够提取更多的信息。引入了倒残差结构,与ResNet(1×1 降维;3×3改变高,宽;1×1升维)相反1×1 升维;3×3改变高,宽;

2023-07-08 21:47:43 78

原创 ResNet

1.通过使用BN解决了梯度消失或梯度爆炸的问题,使数据在一个正态分布内,通过反向传播学习一个合适的均值和方差2.通过残差解决了退化问题(层数多的网络可能效果还没有层数少的网络效果好,但是引入残差块,F(x)+x, F(x)最差为0,解决了上述可能出现的问题)上图对于编写代码更加清晰,但是stage2,3,4 的第一个Bottleneck的stride=2,因为要对图片进行下采样,图中有点小问题参考:https://blog.csdn.net/frighting_ing/article/detai

2023-07-08 12:54:26 41

原创 GoogLeNet

参考:https://blog.csdn.net/sxn0121/article/details/127309179。

2023-07-07 15:25:34 36

原创 VGG

不同版本的VGG的特征提取器不一样,但是分类器是一样的,因此可以区分不同的特征提取器来一次实现多个版本的vgg。7的卷积核,VGG就是通过这样。由上图感受野可知,堆叠3个3。3的卷积核可以代替一个7。

2023-07-06 23:30:21 57

原创 AlexNet

【代码】AlexNet。

2023-07-05 21:45:55 66

原创 迁移学习

以VGG模型为例,使用迁移学习进行一个分类任务。迁移学习主要部分代码。

2023-07-05 17:40:53 42

原创 pytorch 利用卷积核处理图像

对于图像来说,不能直接reshape成你想要的形状,这样显示的图像会出问题,对于numpy.ndarray 可以使用reshape(1,253,253,3) 这种扩维不会改变图片内容,然后用transpose(0,3,1,2)方法二:(处理灰度图像)

2023-07-04 22:57:33 82

原创 鸟类细粒度分类

该数据集特点:可判别区域只在图像的很小的一块区域内,不像那种猫狗分类,只要提取轮廓特征就能进行判别。主要在最后一步,提取玩特征向量之后的外积得到一个高阶的特征(被证明有利于细粒度的分类)采用双线性模型进行识别,确实要比单个模型的效果要好。采用VGG模型作为基模型。

2023-06-04 15:54:15 114

原创 LSTM 原理复现

(某人在复试完之后跟我说有7个,当时我百度都凑不够7个)LSTM 含有3个门:输入门,输出门,遗忘门。

2023-05-10 19:39:08 118

原创 RNN 原理复现

【代码】RNN 原理复现。

2023-05-10 13:55:32 77

原创 Attention-based Seq2seq

来自:Effective Approaches to Attention-based Neural Machine Translation。Attention-based Seq2seq 实现一个分类的任务。

2023-05-08 22:16:17 52

原创 Swin Transformer

Swin Transformer输入图片的尺寸最好是window_size*32 的整数倍import osimport argparseimport torchimport torch.optim as optimfrom torch.utils.tensorboard import SummaryWriterfrom torchvision import transformsfrom my_dataset import MyDataSetfrom model import swi

2023-05-06 11:25:03 151

原创 Vision Transformer 实现图片分类

Vision Transformer 实现图片分类

2023-04-16 14:42:05 483

原创 Attention Is All You Need

Transformer Encoder 实现2分类:基于Transformer 实现谣言检测系统

2023-04-12 17:12:57 88

原创 将公开的模型作为预训练加载,然后修改部分网络模型进行微调

复现文章的代码,但是没办法对齐baseline。

2023-03-31 10:53:47 161

原创 VLNCE复现遇到的问题

VLNCE复现的问题

2022-11-17 21:54:47 720

原创 卷积神经网络

网络结构实现代码import mathimport numpy as npimport h5pyimport matplotlib.pyplot as pltimport matplotlib.image as mpimgimport tensorflow as tffrom tensorflow.python.framework import opsimport tf_utilsimport cnn_utilsnp.random.seed(1)X_train_orig , Y_

2022-05-28 19:45:33 90 1

原创 Deep Neural Network (Tensorflow)

Deep Neural Network (Tensorflow)仅用于自己学习使用依赖的库import numpy as npimport h5pyfrom matplotlib import pyplot as pltimport tensorflow as tffrom tensorflow.python.framework import opsimport tf_utilsimport timeimport matplotlib.pyplot as plt # plt 用于显示图片

2022-05-15 20:51:00 134

原创 Deep Neural Network

Deep Neural Network仅用于自己学习使用依赖的库import numpy as npimport h5pyimport matplotlib.pyplot as pltfrom pyrsistent import bfrom regex import Bimport testCases #参见资料包,或者在文章底部copyfrom dnn_utils import sigmoid, sigmoid_backward, relu, relu_backward #参见资料包i

2022-05-01 18:50:44 894

原创 Ubuntu18.04运行matterport3D tasks/R2R 环境相关配置

Ubuntu18.04运行matterport3D tasks/R2R 环境相关配置

2022-03-22 16:28:49 1845 1

原创 Ubuntu18.04安装matterport3D simulator的方法

Ubuntu18.04安装matterport3D simulator的方法Matterport3D的github地址:https://github.com/peteanderson80/Matterport3DSimulator官方提供了两种安装模拟器的方式:使用docker安装,或者不使用docker安装。文章目录(我选择docker安装)Ubuntu18.04安装matterport3D simulator的方法 1. 向开源项目组要求数据集 2.用docker

2022-01-30 17:39:39 3991 12

原创 **Ubantu18.04安装网卡驱动 Device c822**

Ubantu18.04安装网卡驱动 Device c822华硕天选AMD R74000H 安装双系统Windows10 +Ubantu 18.04 不知道怎么回事网卡驱动老是掉,今天试了一天终于整好了解决方法查看自己的网卡信息我的网卡驱动是Device c8222.下载驱动。在GitHub上有大佬提供了RTL8822CE驱动的linux版,在此给出github链接,大家有需请自行前往下载:https://github.com/juanro49/rtl88x2ce-dkms,Readme

2021-03-27 23:37:04 2403 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除