自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xiaomu_347的博客

一只误入歧途的编程喵

  • 博客(164)
  • 资源 (11)
  • 收藏
  • 关注

原创 深度学习框架比较分析及各种版本mnist识别

现在市场上流行的深度学习框架很多,常用的有tensorflow, keras,MXNet, Torch, Caffe, Theano等几种,通过对比分析可以得到:框架 开发语言 优劣及难易程度 tensorflow c++/cuda/python 资料全,灵活性好,适应性广,但前期上手难 keras c++/cuda/python ...

2019-09-06 09:37:31 716

原创 深度学习中常见的打标签工具和数据集集合

集大家之所长汇集于此,希望对有需要的你能有所帮助。一、打标签工具(1)labelimg/labelme这两款工具简便易行,前者主要用于对目标进行大致的标定,用于常见的框选标定,后者主要用于较为细致的轮廓标定,多用于mask rcnn等。安装也是很方便的,直接在终端下用pip install labelimg即可(至于labelme,需要先安装pyqt,所以先pip insta...

2018-11-05 11:12:34 47914 12

转载 从CNN到SSD目标检测机器学习方法总结

目标检测方法比较:object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。object detection要解决的问题就是物体在哪里,是什么这整个流程的问题。其中检测算法的发展如下,本文主要关注后半部分的,首先可以看一下CNN,它主要用来提取图像特征做分类。(一)图像分类:CNNhttps://blog.csdn.net/l...

2018-09-03 11:36:56 5567 1

原创 Windows下用c++来调用tensorflow训练好的模型

在尝试用c++来调用tensorflow训练好的模型时确实花了一些时间,现在总结一下,以供后续的学习: 首先我想说明的一下是常见的tensorflow训练好的模型保存方式有两种:ckpt格式和pb格式,其中前者主要用于暂存我们训练的临时数据,避免发生意外导致训练终止,前面的努力全部白费掉了。而后者常用于将模型固化,提供离线预测,用户只要提供一个输入,通过模型就可以得到一个预测结...

2018-07-14 11:13:51 37662 123

原创 自动驾驶自动泊车场景应用总结

自动泊车技术是当前智能驾驶技术的一个重要分支,其目标是通过车辆自身的感知、决策和控制系统,实现车辆在有限空间内的自主泊车操作。目前自动泊车可分为半自动泊车、全自动泊车、记忆泊车、四种产品形态,其中, 根据搭载传感器和使用场景的不同,全自动泊车又可分为基于超声波的全自动泊车、超声波融合环视摄像头的全自动泊车、遥控泊车三种形态。随着自动泊车技术的不断迭代,自动泊车功能的实用性也越来越强。目前存在的自动泊车的典型方案如下。

2024-09-12 15:22:07 376

原创 nvidia常用的一些工具

Nvidia作为GPU王者,无论是生产学习游戏都占据半壁江山,尤其是AI时代的爆发,让Nvidia的生意更是如日中天。下面对Nvidia开放的一些免费工具进行总结,学会怎么使用会让我们更好的发挥Nvidia系列产品的性能。

2024-09-12 10:28:05 830

原创 Deepspeed框架学习笔记

在使用 DeepSpeed 训练大模型时,除了常规的模型设计和数据准备外,还需要特别关注内存管理混合精度通信优化和分布式训练的配置,以确保大模型能够高效、稳定地训练。参考链接:1、2、DeepSpeed-CSDN博客。

2024-09-07 18:02:32 183

原创 交叉编译学习总结

后缀,但它实际上是一个可在 Unix 系统上运行的可执行文件,并不是 Windows 可执行文件格式。要生成可以在 Windows 上运行的可执行文件,您需要在 Windows 上使用 MinGW 或者在其他操作系统上使用交叉编译工具链来生成真正的 Windows 可执行文件。通过这些步骤,您就可以在 Linux 或 macOS 上轻松生成 Windows 可执行文件。这样生成的 `hello.exe` 文件可以直接在 Windows 系统上运行。》在 Linux 上安装 MinGW 交叉编译工具链。

2024-09-01 19:50:50 1002

原创 linux下shell简单使用配置说明

中查看内置的主题样式和对应的主题名。这些内置主题已经放在 ~/.oh-my-zsh/themes 目录下,不需要再下载。但是这里推荐安装使用第三方主题powerlevel10k,下载链接。新开一个 Shell Session,就可以开始使用 zsh 了。基于此然后来安装oh-my-zsh。然后将其放到指定文件夹 ~/.oh-my-zsh/custom/themes/下即可,接下来编辑 .zshrc的ZSH_THEME字段。下面以oh-my-zsh为例进行说明,其他的可以自己去尝试,在ubuntu上。

2024-09-01 10:29:40 154

原创 毫米波检测算法总结

毫米波雷达(Millimeter-Wave Radar, mmWave Radar)因其高分辨率、全天候工作能力以及在自动驾驶和工业应用中的重要性,得到了广泛关注。毫米波雷达检测算法主要用于处理雷达信号以实现目标检测、跟踪和分类。

2024-08-28 10:34:00 47

原创 web应用程序之服务器部署

当一个web应用层序开发好后,无论你是用什么语言,最后都要考虑部署到服务器上测试使用,这里就常见的服务器上部署进行如下的摸索总结。以django项目为例,下面就详细的部署进行如下阐述,参考链接:1、https://blog.csdn.net/shudaqi2010/article/details/71172683(深入理解uwsgi和gunicorn网络模型)2、https://segmentfault.com/a/11900000203...

2024-08-27 23:25:44 906

原创 海思芯片部署学习笔记

​目前,‌海思芯片在自动驾驶领域的应用主要包括MDC计算平台和晟腾AI芯片系列。

2024-08-23 17:39:51 82

原创 黑芝麻芯片部署学习笔记

这一点不得不说一下了,黑芝麻的相关资料真的太少,而且不多外开放,这就导致刚开始入门有点盲人摸象的感觉,其官方论坛网站目前还只对合作方开放,如有合作意向请联系邮箱mkt@bst.ai,感觉有点限制了其发展,这一点还不如地平线来的敞亮。根据这篇博客的说明,可以按照博主的操作。由于自己手头上没有黑芝麻的板子,后续的摸索就等哪天拿到实物再进行记录吧。

2024-08-23 16:47:49 89

原创 并行计算和同/异步编码

同步编程简单但可能低效。异步编程适用于I/O密集型任务,通过事件循环实现并发。并行计算利用多线程或多进程同时执行多个任务,适用于CPU密集型任务。通过合理选择和结合这三种编程模型,可以根据不同的任务需求优化程序性能。

2024-08-22 09:58:23 968

原创 docker安装使用系列之交叉编译

在x86平台上使用Docker实现跨平台编译ARM端程序,通常需要使用适当的工具链和Docker镜像来创建交叉编译环境。

2024-08-19 21:39:18 771

原创 Jetson nano部署安装总结

秉持着选旧不选新的原则,推荐选择JetPack 4.6.x版本,如果你想使用yolov7以上的tensorrt加速,建议选择JetPack 5.0.2版本,因为JetPack 4.x版本最高支持的tensorrt只有8.2.1,而将onnx转engine的时候会报错,这个bug在8.4.1的时候修复了(当然也有可能只是部分人的问题)Jetson系列板卡是算法边缘端部署无法避开的一道坎,作为英伟达旗下产品,可以使用tensorrt加速,因此用户较多,生态较好;, 如果还想要配置tensorrt,则可以拉取。

2024-08-18 22:32:11 59

原创 Nvidia细节说明

Isaac ROS和DeepStream是NVIDIA针对不同应用领域推出的两款强大工具。Isaac ROS适用于机器人开发,特别是利用ROS生态系统的项目,而DeepStream则专注于视频流处理和深度学习推理,适用于智能视频分析应用。两者都利用NVIDIA的硬件加速能力和深度学习技术,但在具体的应用领域和开发框架上有所不同。

2024-07-31 14:41:16 40

原创 cuda替代方案总结

OpenCL(Open Computing Language)和CUDA(Compute Unified Device Architecture)是两种用于并行计算的框架,分别由Khronos Group和NVIDIA开发。尽管它们都用于高性能计算,但它们在设计理念、编程模型和使用场景上存在一些显著的差异。

2024-07-24 18:01:01 52

原创 基于c++的并行化加速处理

针对C++脚本进行并行化,可以利用多种并行编程技术来提升性能。

2024-07-24 15:52:24 760

原创 模型训练部署之手搓一个卷积操作

这是一个最基础卷积操作,使用双重循环遍历输入矩阵,进行卷积操作,未对边界情况进行处理(例如零填充或镜像填充),如果需要处理边界,可以在输入矩阵的周围添加适当的填充值。填充后的矩阵尺寸会增加,卷积结果矩阵的尺寸将与原始输入矩阵尺寸相同。在C++中,有多种常见的数据运算加速库可以用来优化卷积操作。- MKL是Intel提供的一个高性能数学库,主要用于科学计算和工程计算。- cuDNN是NVIDIA提供的深度学习加速库,包含高效的卷积操作。- Eigen是一个高性能的C++库,主要用于矩阵和线性代数运算。

2024-07-15 16:41:16 31

原创 车道线检测学习笔记

过于先验,需要大量数据才能解决大区率弯道或者转弯场景。车道线强假设 地平假说,刚性映射:地平,内外参,带有先验的学习了车道线的结构,车道线平行度等。车道线的结构,内外参,地面曲率 融入网络结构。短线与遮挡情况,需要保证模型预测的稳定性。多趟重入,使用定位与建图技术进行优化。>分离出线与线的逻辑功能的标注。逻辑功能可后续升级不同版本标注。虚线在行进中的连续性标注。的信息量不足,需要视觉补充。>以实际应用逻辑为目标。能够表达出路面实际情况。地面高度标注的精度要求。

2024-07-14 23:56:36 29

原创 graphrag+ollama+neo4j本地化部署可视化使用

最近微软团队开源了一款数据工作流与转换工具 GraphRAG,利用LLM,帮助用户从非结构化文本数据中提取结构化数据,并完成数据索引。与传统的在文本片段中,基于语义查询的RAG不同,GraphRAG从原始文本中,提取数据,构建知识图谱,并利用这些结构化数据完成RAG任务。这取决于输入数据的大小、使用的模型以及使用的文本块大小(这些可以在文件中配置。要找到适当的部分,只需搜索配置。,您应该会看到两个部分,一个用于聊天端点,一个用于嵌入端点。pipeline完成后,您应该会看到一个名为的新文件夹,而在。

2024-07-12 18:39:15 1126

原创 DMS/OMS检测现状分析

DMS是英文Driver Monitor System的缩写,即驾驶员监控系统。目前主流是利用2D或3D的摄像头方案(一般带红外功能)实现对驾驶员的身份识别、驾驶员疲劳驾驶以及危险行为的检测功能,是目前流行的ADAS(高级驾驶辅助系统)系统中重要组成部分。自动驾驶技术研发商MINIEYE发布了其自主研发的MINIEYE I-CS(In-Cabin Sensing)座舱感知量产方案。

2024-07-12 14:28:10 48

原创 基于瑞芯微芯片模型部署

瑞芯微的主要产品智能应用处理器芯片,是SOC的一种,属于系统级的超大规模数字 IC。SOC通常内置中央处理器(CPU)和图形处理器(GPU),并根据使用场景的需要增加图像信号处理器(ISP)、神经网络处理器(NPU)、多媒体视频编解码器及音频处理器等处理内核。其智能应用处理器芯片可以分为内置 NPU 的人工智能应用处理器芯片和不带 NPU 的传统智能应用处理器芯片。下面以RK3588部署yolov5为例进行如下说明。RK3588是瑞芯微(Rockchip)公司推出的一款高性能、低功耗的集成电路芯片。

2024-07-09 16:44:31 37

原创 基于地平线J5/J3部署深度学习模型

模型转换的第一步是模型检查,该步骤将分析模型与硬件平台的兼容性。在模型检查阶段,模型将被拆分为适合BPU和CPU运行的子图,理想情况下,我们期望仅存在一个运行在BPU上的子图。在进行ONNX模型转换时,需注意X3硬件架构的特定要求:它仅支持ONNX Opset 11版本,且模型输入维度限定为NCHW或NHWC,同时只支持批次为1的操作。地平线X3硬件平台的BPU单元主要支持INT8,尽管市场上如华为Atlas200 NPU等产品也支持FP16精度,但在以卷积计算主导的网络输出中,这两者间的精度差异并不大。

2024-07-09 14:44:48 138

原创 3D目标检测总结

3D目标检测的整个目标是通过绘制定向的 3D 边界框并分配标签来识别感兴趣的目标。考虑两种常用的3D目标检测方式,即,检测3D空间中的物体对于增强现实、机器人和自动驾驶等广泛应用至关重要。3D探测器将生成具有大小、位置、方向和类别参数的3D边界框,以对检测到的物体进行定位和分类,使系统能够感知和理解周围环境。3D物体探测器可分为。这项愿景任务的关键挑战与我们的使用方式、表现方式以及组合方式密切相关。由于手头只有图像,核心挑战来自缺乏深度信息。

2024-07-08 13:28:42 47

原创 c++项目基础学习

对于一个常见的c++脚本想要将其编译成可执行文件还是动/静态库,主要还是看该脚本具体操作和实现,是否具备函数主入口(main函数),如果有则将其编译成可执行文件,否则只能将其编译成动/静态库,提供一个接口供别人去使用。还是上面的示例脚本,只不过需要去掉main函数,为了方便后面的调用,拆分成一个头文件和具体的函数实现。最后编译项目完成调用,看一下完成上面操作后整个项目目录结构。函数放入一个源文件中,例如。然后,创建一个头文件。主要的脚本内容如下,(2)编译动/静态库。这里先构建接口函数,

2024-07-03 16:24:53 833

原创 c++项目学习

对于c++程序中经常出现的越界或者内存溢出等问题,这里推荐ASAN进行扫描.对于c++一般项目而言,整个项目结构如下,

2024-07-02 22:05:51 757

原创 基于selenium+python实现自动化测试

Selenium 是一个用于自动化Web应用程序测试的工具包,它提供了一套API,允许开发者编写脚本来模拟用户与浏览器的交互。使用Selenium结合Python进行自动化测试是一个常见的选择,因为Selenium是一个强大的工具,可以模拟用户与网页的交互。例如,如果你使用的是Chrome浏览器,你需要下载ChromeDriver。其中,Selenium不仅可以用于打开网页和获取页面信息,它还可以模拟许多其他的浏览器操作。Selenium非常灵活,可以模拟几乎所有的浏览器操作,满足各种自动化测试的需求。

2024-07-01 17:00:14 2071

原创 深度学习模型部署遇到不支持op时

在对superpoint进行部署时,当trt版本为8.4时出现对grid_sample的不支持,对于grid_sample原理可以参考。

2024-07-01 14:05:11 27

原创 基于llm+rag构建自己的知识图谱

点击进去会有一个注册框,填写完成自己的信息之后会进入下载页面。同时需要注意保留页面左下角的激活码。按照下载页面的安装说明进行安装。这些数据库在存储和查询知识图谱数据时具有不同的特点和优势,选择适合自己需求的数据库取决于具体的应用场景和性能需求。至于llm和rag技术这里不做过多赘述,可以查看前面的学习笔记,下面主要介绍一下知识图谱,,密码在首次登录时设置。接下来就像mysql数据那样,可以直接通过Neo4j浏览器进行操作。在浏览器中打开Neo4j Web界面,并登录。而三元组是图中的基本数据单元。

2024-06-29 15:52:44 316

原创 cuda编码入门学习笔记

首先,确保你对CUDA编程的基本概念有所了解:- CUDA是NVIDIA提供的用于并行计算的平台和编程模型。- CUDA允许你利用NVIDIA GPU的并行处理能力来加速计算任务。

2024-06-27 23:03:00 846

原创 自动驾驶训练数据集处理总结

下载速度就看你自己的网速带宽了,配合科学上网挂在后台应该还是没多大问题的。然后找到下载页面下载,这里推荐第二种方式,基于wget直接下载。

2024-06-25 14:12:31 465

原创 自动驾驶相关的传感器和坐标系

投影坐标系统主要是指以米为单位表示距离和大小的平面直角坐标系,需要进行一种坐标变换或映射关系,将用于定位的地理坐标系统中的经纬度信息转换为以米为单位的平面直角坐标,常见的标准有UTM坐标系。在立体视觉中,深度 𝑑 通常指的是物体到相机成像平面(即焦平面)的距离,而不是物体到相机光心(即相机的投影中心)的距离。下图中左图为世界坐标系和相机坐标系的关系示意图,在相机坐标系中原点为成像平面的中心,与z轴垂直的平面对应焦距平面,右图为像素图像坐标系和物理图像坐标系的关系示意图,像素图像坐标系的原点在图像的左上角。

2024-06-22 16:24:36 143

原创 python与c++混合编码

此外,一些项目利用 pybind11 进行跨平台开发,例如 OpenKE,它使用 C++ 重写底层数据处理,并通过 pybind11 实现 Python 和 C++ 的交互,实现跨平台功能(包括 Windows 和 Linux)57。,第二个其实是一个pybind11::module类型,m.doc后面填对于这个模块的解释,m.def后面第一个参数是你想在python里写的函数名,第二个参数是绑定的函数地址,后面是对函数的解释可写可不写,有几个函数实现就添加几个m.def功能。文件通常是平台特定的,

2024-06-21 14:51:03 929

原创 3d检测️之视觉bev检测算法

在这其中第二步是现有的端到端的多视角3D目标检测方法的核心,起到了承上启下的关键作用。

2024-06-20 21:26:53 61

原创 基于cuda实现自定义torch算子

在这个例子中,`my_cuda_module.cpp`定义了一个C++函数`my_add_function`,它准备数据并调用`my_cuda_add_kernel` CUDA核函数。- 在`setup.py`中使用`torch.utils.cpp_extension`或`distutils`来定义你的C++和CUDA扩展模块。- `.cu`文件包含了CUDA特有的语法和函数,例如 `__global__` 声明,用于定义在GPU上并行执行的函数。- 在`.cu`文件中,你定义CUDA核函数。

2024-06-19 17:30:29 783

原创 occ网络学习

Occ网络(Occupancy Network)是一种用于3D场景表示的深度学习模型。它通过一个神经网络将空间中的每个点映射为其是否被占据的概率,从而能够表示复杂的几何形状。

2024-06-17 22:24:19 18

原创 llama-factory学习使用笔记

想要对开源的llama大模型,针对自己的数据进行微调,这里推荐llama-factory项目,LLama Factory,这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程,并且易于访问,使用体验友好。当模型和数据都已经配置完成,接下来就是开始训练了,这里我采用的是基于llama2-7b的模型,加上自己的中文数据利用lora方法进行sft,其他的参数设定如下。这样刷新后在加载数据时就可以看到自己添加的数据了,还可以对内容进行可视化。

2024-06-17 15:37:58 961

原创 基于Tensorrt-llm完成对llm部署

随着大模型的爆火,投入到生产环境的模型参数量规模也变得越来越大(从数十亿参数到千亿参数规模),从而导致大模型的推理成本急剧增加。因此,市面上也出现了很多的推理框架,用于降低模型推理延迟以及提升模型。TensorRT-LLM 为用户提供了易于使用的 Python API 来定义大语言模型 (LLM) 并构建 TensorRT 引擎,以便在 NVIDIA GPU 上高效地执行推理。TensorRT-LLM 还包含用于创建执行这些 TensorRT 引擎的 Python 和 C++ 运行时组件。

2024-06-16 16:15:41 850

yolo系列预训练权重.txt

在训练yolov模型时,难以避免的会用到预训练模型,这里帮你整理了yolo系列训练所需要的大部分预训练权重,避免了你需要在外网下载的龟速,希望可以帮到正在需要的你。

2021-03-03

matrixcookbook.pdf

在刚接触机器学习时,对误差传导求解是不是一脸懵逼,对神经网络信息前向传递,误差反向传导的流程推理是不是很不熟练,尤其是矩阵求导,向量求导,雅克比矩阵、hessen矩阵等,那么这份资料也许可以助你一臂之力。

2020-08-23

rufus_files.7z

针对轻量软件Rufus在制作系统盘时会出现需要下载ldlinux.sys和ldlinux.bss文件,而下载又总是失败,故在这里提供给需要的大家!只需要将rufus_files文件解压到和Rufus同一路径即可,制作时会自动检查读取。

2020-05-03

get_pre_model.zip

忍受不了预训练下载参数慢的小伙伴们看过来吧!这里让你畅想飞翔版的感觉

2019-10-27

GitLearning.docx

对于需要协调合作的项目而言,这时候我们需要借助到git来帮助我们更好的进行开发和版本控制。

2019-08-04

利用socket实现客户端服务器之间简单通信

利用socket实现客户端与服务器之间的简单通信,快速熟悉掌握三次握手与四次挥手。。。

2018-12-06

通信协议面试总结

通过面试的洗礼总结的通信协议相关的问题,希望可以助你一臂之力。

2018-09-26

手机端实现机器学习分类app

直接下载到手机上就可以体验到目标检测识别的乐趣了。。

2018-08-09

opencv3 毛星云 随书代码

希望可以帮到处在图像处理初级阶段的你

2017-07-29

MFC包含的库文件集合

想要做界面而又不太熟悉mfc封装的库,那就看过来,希望可以帮到你。

2017-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除