- 博客(182)
- 资源 (1)
- 收藏
- 关注
原创 论文阅读 Vision Transformer - VIT
通过将图像切成patch线形层编码成token特征编码的方法,用transformer的encoder来做图像分类multihead和我原有的理解偏差修正。我以为的是QKV会有N块相同的copy(),每一份去做后续的linear等操作。代码里是直接用linear将QKV分为一整个大块,用permute/rearrange的操作切成了N块,f(Q,K)之后再恢复成一整个大块,很强。
2024-01-15 14:25:13 732 1
原创 论文阅读 BERT GPT - transformer在NLP领域的延伸
双向 编码器加上mask做完形填空超大模型无监督预训练 需要整个模型作为pretrain weight到下游任务做fintune总结个毛。
2024-01-09 19:02:30 790 1
原创 论文阅读 Attention is all u need - transformer
提出一个仅需要self attention + linear组合成encoder+decoder的模型架构。
2024-01-09 15:29:46 1326
原创 ros cvbridge opencv4.x冲突
https://blog.csdn.net/qinqinxiansheng/article/details/120219388
2023-08-10 16:57:16 77
原创 gdb rosrun
https://blog.csdn.net/bpsoda/article/details/129869474https://blog.csdn.net/bpsoda/article/details/129869474
2023-08-09 17:00:03 64
原创 rosrun image_view extract_images _sec_per_frame:=0.05 image:=<IMAGE TOPIC IN BAGFILE>
rosrun image_view extract_images _sec_per_frame:=0.05 image:=rosrun image_view extract_images _sec_per_frame:=0.05 image:=
2023-08-03 13:31:44 133
原创 ros catkin_make 会去找conda里的依赖
https://blog.csdn.net/qq_42946643/article/details/129060321
2023-04-26 17:43:23 193
原创 点云分割预研(可行方案)
主要是对上一篇点云分割预研的补充。上一篇文章主要是了解点云分割的整体生态,这篇文章主要记录模型选型,模型调试,模型测试,模型部署相关内容。下一篇应该是所选模型的对比及测试。
2023-03-21 20:33:38 291
原创 CV2 开闭
图像开运算是图像依次经过腐蚀、膨胀处理后的过程。图像被腐蚀后,去除了噪声,但是也压缩了图像;接着对腐蚀过的图像进行膨胀处理,可以去除噪声,并保留原有图像。开运算实际是先腐蚀运算,再膨胀运算,把看上去把细微连在一起的两块目标分开了。一般来说,开运算可以使图像的轮廓变得光滑,还能使狭窄的连接断开和消除细毛刺。开运算在过滤噪声的同时并没有对物体的形状、轮廓造成明显的影响,这是一大优势。当只关心物体的位置或者个数时,物体形状的改变不会给任务带来困扰,此时用开运算处理具有处理速度上的优势。闭运算是开运算的相反操作,先
2022-07-08 11:10:22 478
原创 detection 小缺陷检测方案
jetson TX2tensorrt 7/8cuda 10.2MVS hikcamerayolov5v6.0 ultralytics/tensorrtx方案:1.直接训练v5L模型2.转换tensorrt模型效果:1280肯定优于640推理速度:120ms(L,640),430ms(L,1280)方案:1.24482048 原图2.12001200 resize3.6406404 split4.24482048 merge推理速度:120ms(S,30ms4),500ms(L,12
2022-07-07 16:34:38 773
原创 TensorRT QT交叉编译
用QT可以直接把NvInfer的库文件和头文件拷出来编译,然后直接放到盒子上运行,注意tensorrt版本(7,8头文件有区别,所以编译不通用),模型要和盒子对应
2022-07-04 08:54:19 500
原创 TX2 读取海康/大恒工业摄像头 显示/保存
1 MVS下载或SDK下载在海康机器人官网,服务支持-软件下载中间中,下载相应的客户端安装包。2 放到TX2目录下解压并安装sudo tar –xvf MVS-2.1.1_aarch64_20220511.tarsudo ./setup.sh3.c/c++ 库文件和头文件都在opt/MVS/下4.samples里面可以直接make就可以玩了5.读取工业摄像头并用转为cv::Mat用yolov5-trt推理5.1 cmakelistscmake_minimum_required(VER
2022-05-30 09:16:21 1279 4
原创 C/C++ 自定义sort方法
转#include<iostream>#include<algorithm>#include<vector>#include<opencv2\opencv.hpp>using namespace std;using namespace cv;vector<cv::Point2d> po; //自定义排序函数 bool sortFun(const cv::Point2d &p1, const cv::Point2d &a
2022-05-24 13:31:51 365 1
原创 C/C++ YAML玩法
配置文件width : 640height : 360framerate : 25.0faces_active: [5,6,7,1] cameras_active: [1,2,3] channels: - rtsp: rtsp://admin:[email protected]:554/Streaming/Channels/102 chn: 1 - rtsp: rtsp://admin:[email protected]:554/Streaming/Ch
2022-04-26 15:10:02 592
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人