自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 yololov5-切割检测-detect.py

函数,该函数包含了整个流程的实现。在处理过程中,将输入图像切割为多个小图像,并对每个小图像进行目标检测。最后修改了参数,指定了模型权重文件、输入图像文件夹路径、数据集描述文件路径以及结果保存目录路径等参数,并调用。将图像切割为8张小图,对每个小图进行目标检测后,将检测结果拼接到最后的大图。,然后遍历每个小图像的检测结果,将检测框绘制在原始大图像上,并添加类别和置信度信息。函数,用于将输入的大图像切割成指定大小的小图像,并返回切割后的小图像列表。函数将检测结果合并到原始大图像上,并保存带有检测结果的图像。

2024-02-20 19:54:35 740

原创 推理完的小图合并为大图

之前说过大图切割成小图,小图推理,但是最终呈现的结果肯定是要返还回去变成大图的。这个就是jpg格式拼接回去。之前给出的demo它生成之后,就是全部都在一个文件夹内,文件名从0开始排序。所以自己就做了一个根据顺序拼接的代码。然后拼接过程中,把切割的时候增加的黑色区域剪裁掉。因为对C++不是很熟悉,所以是先写的python理了思绪,后面在写的C++。需要python程序可以留言,私发给你。基本上对环境没啥特别要求。因为写的时候本身就规避了很多库迎合服务器的环境。

2024-02-20 19:40:30 539

原创 图像分割并转为bgr格式

这个代码主要是项目需要,因为海康的超脑给的demo是处理bg文件格式,且由于为了迎合原本yolov5模型的极小目标检测场景。海康摄像头采集的大图resize检测效果太差,只能考虑把大图裁剪成多个小图做推理提升效果。代码有C++和opencv两个版本。其他的都是基于基本库实现的。

2024-02-20 19:29:36 933

原创 旋律生成学习日记(二)歌词生成旋律LSTM+GAN

直接输入单词,千万别用中文,不然会报错,我自己试了下跑了下效果,和我自己跑的LSTM比起来,效果强了很多,能明显感觉到旋律的变化,但是离我想象中的效果还差了很多,跟AI生成图像的效果比起来,AI生成音乐着实有些拉跨了。代码实在太长了我就不贴了,反正自己下,代码基本没有啥问题,自己改的时候也是因为实在是懒得换tensorflow的版本,下次我还是找找torch的吧。以歌词作为输入,我们的目标是预测一个与歌词顺序对齐的旋律,其中MIDI数字、音符持续时间和休息时间时长与歌词合成,生成歌曲。

2023-04-19 11:41:10 1267 1

转载 旋律生成学习日记(一)

原文博主说训练时间非常长,我还不信,喵的我错了,我真的错了,一个epoch我的电脑耗时一个小时,根本跑不动,最后拿52个样本跑了十个epoch跑了个模型出来,看看是否能实现。总结,没有一点基础第一次上手,跟我想象的不一样,我还以为会是和图像一样能给标签描述就会给我音频,但是这个方法的实现貌似不是这样的,我开始对这个感兴趣,也是因为chatgpt,提问请给我一段欢快的音频,它也确实能给你一段小调。原文有读取一个文件查看,但是我没有读取,我最后生成的note文件是一片空白,但是最后生成的音乐确实是有声的。

2023-04-16 13:40:23 249 1

原创 tensrflow读取csv构造DNN

DNN tensorflow

2022-10-19 17:46:02 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除