算法贝多芬-CSDN博客

原创 yololov5-切割检测-detect.py

函数，该函数包含了整个流程的实现。在处理过程中，将输入图像切割为多个小图像，并对每个小图像进行目标检测。最后修改了参数，指定了模型权重文件、输入图像文件夹路径、数据集描述文件路径以及结果保存目录路径等参数，并调用。将图像切割为8张小图，对每个小图进行目标检测后，将检测结果拼接到最后的大图。，然后遍历每个小图像的检测结果，将检测框绘制在原始大图像上，并添加类别和置信度信息。函数，用于将输入的大图像切割成指定大小的小图像，并返回切割后的小图像列表。函数将检测结果合并到原始大图像上，并保存带有检测结果的图像。

2024-02-20 19:54:35 1351

原创推理完的小图合并为大图

之前说过大图切割成小图，小图推理，但是最终呈现的结果肯定是要返还回去变成大图的。这个就是jpg格式拼接回去。之前给出的demo它生成之后，就是全部都在一个文件夹内，文件名从0开始排序。所以自己就做了一个根据顺序拼接的代码。然后拼接过程中，把切割的时候增加的黑色区域剪裁掉。因为对C++不是很熟悉，所以是先写的python理了思绪，后面在写的C++。需要python程序可以留言，私发给你。基本上对环境没啥特别要求。因为写的时候本身就规避了很多库迎合服务器的环境。

2024-02-20 19:40:30 665

原创图像分割并转为bgr格式

这个代码主要是项目需要，因为海康的超脑给的demo是处理bg文件格式，且由于为了迎合原本yolov5模型的极小目标检测场景。海康摄像头采集的大图resize检测效果太差，只能考虑把大图裁剪成多个小图做推理提升效果。代码有C++和opencv两个版本。其他的都是基于基本库实现的。

2024-02-20 19:29:36 996

原创旋律生成学习日记（二）歌词生成旋律LSTM+GAN

直接输入单词，千万别用中文，不然会报错，我自己试了下跑了下效果，和我自己跑的LSTM比起来，效果强了很多，能明显感觉到旋律的变化，但是离我想象中的效果还差了很多，跟AI生成图像的效果比起来，AI生成音乐着实有些拉跨了。代码实在太长了我就不贴了，反正自己下，代码基本没有啥问题，自己改的时候也是因为实在是懒得换tensorflow的版本，下次我还是找找torch的吧。以歌词作为输入，我们的目标是预测一个与歌词顺序对齐的旋律，其中MIDI数字、音符持续时间和休息时间时长与歌词合成，生成歌曲。

2023-04-19 11:41:10 1511 1

转载旋律生成学习日记（一）

原文博主说训练时间非常长，我还不信，喵的我错了，我真的错了，一个epoch我的电脑耗时一个小时，根本跑不动，最后拿52个样本跑了十个epoch跑了个模型出来，看看是否能实现。总结，没有一点基础第一次上手，跟我想象的不一样，我还以为会是和图像一样能给标签描述就会给我音频，但是这个方法的实现貌似不是这样的，我开始对这个感兴趣，也是因为chatgpt，提问请给我一段欢快的音频，它也确实能给你一段小调。原文有读取一个文件查看，但是我没有读取，我最后生成的note文件是一片空白，但是最后生成的音乐确实是有声的。

2023-04-16 13:40:23 368 1