深度学习
文章平均质量分 79
FL1768317420
这个作者很懒,什么都没留下…
展开
-
windows编译openpose及在python中调用
如果出现下面类似的错误,就是因为之前的几个依赖,没有下载好导致的,最简单的方法就去看看下载下来的几个。这5个包,自行下载后解压,注意解压后文件夹的名称和文件目录结构,如下图。,填写源码位置和编译后产生的文件的位置,也就是上面刚创建的。,运行之前,需要做一点点修改,主要是4个路径的修改。,这个文件夹是用来存放编译生成的文件的。为解决这个问题,需要修改相应报错的源文件,将。的部分,这个前面讲过了,不会的话,看这篇。,下载后解压,在源码根目录新建个文件夹。这个步骤,会去下载几个主要的依赖,包括。原创 2024-04-11 11:32:21 · 1283 阅读 · 0 评论 -
[openpose]openpose常用终端命令
【代码】[openpose]openpose常用终端命令。原创 2024-04-11 11:10:29 · 712 阅读 · 0 评论 -
ncnn编译过程(win10+vs2017)
这里应该已经编译好了,但是本人想要使用ncnn中的自动量化功能,因此还需要cmake找到opencv后,重新cmake编译。这里需要把opencv的cmake路径加入到cmake 中。(该路径为自己电脑私人路径,需要自己修改)运行nmake install进行安装。参考链接:https://运行nmake进行编译。原创 2024-04-09 07:49:30 · 271 阅读 · 0 评论 -
使用Mask-RCNN训练自己的数据集
等基于神经网络的算法都是基于数据驱动的,数据的好坏会影响你最后生成的模型的好坏,在使用Mask-RCNN时,第一件事就是标注数据集,这里我们默认你已经配置好了anaconda的环境,如果你没有配置好可以参考一下其他人的。现在的.json包含了我们标注的信息,但是还不是可以让代码直接读取的数据格式,对于不同的深度学习代码,数据存放的格式要根据不同代码的写法来定,下面以上述的。2、修改train_test.py的121行,将原有的注释掉,有多少类别就重新写多少行,每行第二个参数是序号,第三个参数是类别名。原创 2024-04-03 07:39:35 · 1334 阅读 · 0 评论 -
[深度学习]win10配置mask rcnn(tensorflow2.0版)
到这里tensorflow-gpu2.0版的mask rcnn就配置结束了,如果老版本配置失败的朋友也可以尝试这样的方式,看看是否可行,关键还是tensorflow-gpu的安装,以及和cuda的匹配问题。之前很多次失败都和tensorflow-gpu安装失败有关,第一次尝试的时候显示安装成功,但是却不可用,可能是有的包安装不全,再加上镜像源的问题,经常会报错(无法下载),大家可以试着切换一下镜像源。这个比较简单,且没什么特别的问题,有很多公众号上都是有安装教程的(白嫖党都懂,不过咱们还是要提倡正版)原创 2024-04-02 20:45:15 · 867 阅读 · 0 评论 -
3588嵌入板块跑rknn yolov5基本方法
3588的深度学习框架是RKNN,官方和网上的资料都不太多,主要需要自己来看了,这个和nvida jetson差的还是比较远,nvidia的嵌入式环境,只要装个对应的torch版本就可以用了,然后可以基于deepstream等框架进行进一步的性能优化。可以看到,rknn其实就提供了一个深度学习的最基础框架,能够基于转换后的模型进程推理预测,至于其他的图片后处理啥的,就要自己做了,当然,也可以结合torch的一些项目自己改。首先是开发环境安装,不建议用conda,直接用系统环境, conda容易出错。原创 2024-03-31 16:08:49 · 814 阅读 · 2 评论 -
YOLOv5_DOTA无人机/遥感旋转目标检测项目代码(数据集制作、模型训练、性能评估、常见问题)
本文为YOLOv5旋转目标检测踩坑纪录篇之一——项目篇:略略略:YOLOv5_DOTAv1.5(遥感旋转目标检测,全踩坑记录)339 赞同 · 240 评论文章编辑文章开头直接放上我自己的项目代码:https://github.com/hukaixuan19970627/YOLOv5_DOTA_OBBgithub.com/hukaixuan19970627/YOLOv5_DOTA_OBBstar⭐还请多多益善。前言:其实这篇文章算比较过时的了,因为已经有人实现了YOLOv5旋转目标的检测:junjiel原创 2024-03-24 16:12:53 · 1503 阅读 · 0 评论 -
yolov5训练自己的数据集
接下来准备labels,把数据集格式转换成yolo_txt格式,即将每个xml标注提取bbox信息为txt格式,每个图像对应一个txt文件,文件每一行为一个目标的信息,包括class, x_center, y_center, width, height格式。dataSet #之后会在Main文件夹内自动生成train.txt,val.txt,test.txt和trainval.txt四个文件,存放训练集、验证集、测试集图片的名字(无后缀.jpg)原创 2024-03-22 19:22:15 · 579 阅读 · 0 评论 -
[深度学习]Chat_with_RTX 支持中文
TensorRT-LLM 编译中文大模型作为替换。目录下 app_config.json 文件。TensorRT-LLM 版本必须一样。安装正常后可以进项编译,这里下载的是。使用下面这个方式解决。原创 2024-03-15 06:36:38 · 693 阅读 · 0 评论 -
[python]基于faster whisper实时语音识别语音转文本
同时,Faster-Whisper还改进了原始的Whisper模型结构,包括减少模型的层数、减少参数量、简化模型结构等,从而减少了计算量和内存消耗,提高了推理速度。此外,Faster-Whisper还改进了推理算法、优化计算过程、减少冗余计算等,以提高模型的运行效率。Faster-Whisper项目包括一个web网页版本和一个命令行版本,同时项目内部已经整合了VAD算法。VAD是一种音频活动检测的算法,可以准确的把音频中的每一句话分离开来,让whisper更精准的定位语音开始和结束的位置。原创 2023-12-31 21:40:31 · 1093 阅读 · 0 评论 -
[ubuntu]ubuntu安装cuda
cuda环境变量的添加:10.2版本11.0版本11.1版本11.2版本11.3版本cudnn安装:或者cudnn适配cuda12.2安装:原创 2023-12-08 21:16:14 · 96 阅读 · 0 评论 -
[ubuntu]ubuntu安装mmcv
安装顺序如下:查看安装成功但是因为conda下载太慢,经常会断,而且我这里遇到了点问题,不知道是不是镜像源配置问题(解决:当时把整个虚拟环境删掉,重新建了),所以可以采用wget方式安装,这里不赘述.官方给出的命令如下:其中,{ }中的版本需要替换成对应版本,不知道的可以查看点击标记的地方,打开里面的网址,可以查看更多的mmcv版本pip list。原创 2023-12-07 09:36:29 · 426 阅读 · 2 评论