rain2211-CSDN博客

原创 PyTorch for Audio + Music Processing(8/9/10) :基于CNN的模型构建/训练/推理

本系列最后一部分：urban sound音频分类神经网络模型的搭建和训练

2022-12-17 15:56:26 1003 3

原创 PyTorch for Audio + Music Processing(2/3/4/5/6/7) :构建数据集和提取音频特征

本系列本来打算每一章都写笔记记录下来，不过看来几个视频之后，发现2，3其只是在普及torch以及复现基础手写字体识别的例子，与torchaudio和音频处理关系不大，就跳过，感兴趣的可以直接看代码。

2022-11-23 11:04:04 1762 1

原创 PyTorch for Audio + Music Processing(1) :Course Overview（课程大纲）

本系列文章为作者Valerio Velardo在youtube的频道 The Sound of AI发布的PyTorch for Audio + Music Processing系列的教程笔记，适合快速入门如何使用pytorch处理音频和音乐，课程中从处理音频数据、构建数据集和dataloader，到构建一个简单的分类器并完成训练和预测，都有比较详细的讲解。

2022-11-23 11:02:49 505

转载基于mklink创建目录链接解决conda环境占用C盘空间太大的问题

基于mklink创建目录链接解决conda环境占用C盘空间太大的问题

2022-11-14 12:06:15 814

原创音乐转录（AMT）库Omnizart论文笔记及实践

自动音乐转录（AMT），从原始音频推断音符，是音乐理解核心的一项具有挑战性的任务。Omnizart库是一个用于AMT任务的python库，收集了目前各种乐器转录的SOTA模型，并提供了统一的命令行接口。本文记录了论文的笔记以及在简单鼓节奏的测试。

2022-11-08 11:31:51 976

原创在LMMS中导入mid文件并播放

LMMS下载音色并播放mid文件

2022-11-05 15:58:34 722

原创【mido之架子鼓编曲】

midi是基于事件的通用音乐表现格式，是计算机音乐的基础数据结构。mido为用于解析和生成Midi文件的python库，本文以mido库来生成常见的架子鼓节奏。尝试了mido来生成鼓的基本节奏，可以作为计算机混音，编曲，转录的基础。

2022-11-04 12:20:38 1364 1

原创【基于transformer的歌词分类】

从0到1实现基于transformer的歌词风格分类

2022-05-02 16:20:21 963

原创搭建基于nginx+gunicorn+flask的ai服务平台

概念：wsgi:Web服务器网关接口（Python Web Server Gateway Interface，缩写为WSGI）是为Python语言定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口。Flask:python web微服务开发框架gunicorn:在unix系统运行的wsgi服务器nginx：http和反向代理服务器（客户端无法感知代理的存在）总体...

2020-06-30 17:38:12 469

原创基于flask+pytorch的yolov3目标检测服务开发

背景：以yolov3为例子，构建基于flask的微服务架构，对外提供算法能力。制定服务的接口规范，后续有新的算法模型，也可以按照此例子的做法，快速地部署。概念：wsgi:Web服务器网关接口（Python Web Server Gateway Interface，缩写为WSGI）是为Python语言定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口。Flask:py...

2020-05-07 10:23:08 3138 1

转载 CS231n: Convolutional Neural Networks for Visual Recognition

课程介绍Computer Vision has become ubiquitous in our society, with applications in search, image understanding, apps, mapping, medicine, drones, and self-driving cars

2017-03-07 13:46:17 427

原创 CS131-PA2 通过聚类实现前/背景分离 Foreground-Background Segmentation via Clustering

通过聚类实现前/背景分离图像背景分离也称图像切割，原理是利用聚类算法将图像进行聚类，聚为不同的若干个类，这些类别即包含了图像的前景和背景。此项目包含以下几个方面：聚类方法：实现K-Means和Hierarchical Agglomerative算法点特征向量：实现ComputePositionColorFeatures（颜色和位置）方法和特征归一化不同参数实验并分析

2017-01-01 17:14:04 1655 1

原创 CS131-PA1 全景拼接Panorama Stitching

全景拼接(Panoramic stitching)是机器视觉应用比较早也比较成功的方向,目前有大量的应用,比如google的街道全景图,手机的全景图像拼接,各种拼接软件(Photosynth and AutoStitch)等等.本文方法是通过计算不同图像sift特征，并计算出图像之间的仿射关系，从而拼接出全景图像

2016-12-31 13:59:11 3458

转载斯坦福视觉课程CS131简介

Stanford UniversityCS 131 Computer Vision: Foundations and ApplicationsFall 2015-2016Announcements: • Welcome to CS131! • Schedule information may change during the qua

2016-12-31 13:42:05 10081 2

转载布朗大学视觉课程CS143简介

CS 143 Introduction to Computer VisionFall 2013, MWF 1:00 to 1:50, Kasser House, Foxboro AuditoriumInstructor: James HaysTAs: Hari Narayanan (HTA), Libin "Geoffrey" Sun, Greg Yauney, Bryce Aebi,

2016-12-31 13:16:48 1052 3

原创 CS143-project4基于滑窗的人脸检测 Face detection with a sliding window

ttt

2016-12-29 17:37:14 3404 1

原创 CS143-project3 基于bag of words 的场景识别 Scene Recognition with Bag of Words

本项目实现两种不同的图像表示——小图像和SIFT特征包，以及两种不同的分类技术——最近邻和线性SVM。通过试验得到准确率是小图像和最近邻分类器 (准确率20.50%).SIFT表示包和最近邻分类器 (准确率49.99%).SIFT表示包和线性SVM分类器 (准确率68.10%).

2016-12-28 11:23:38 1158 1

原创 CS143-project2 局部特征匹配 Local Feature Matching

本项目通过harris算法对图像进行兴趣点的检测和提取。然后计算兴趣点周围4*4区域的8个方向特征向量，最后对获取到的特征向量对进行匹配。本算法对旋转，缩放，亮度变化保持一定程度的稳定性。环境：操作系统：WIN7实现平台：MATLAB2014a 本项目主要包括以下4部分：特征点检测和提取(harris).生成特征算子(sift).图像匹配(match).实验DEMO

2016-12-27 17:26:08 4344 5

原创 CS143-project1 图像过滤与图像混合Image Filtering and Hybrid Images

本文主要通过线性过滤器原理对图像进行过滤，并根据自定义的过滤器截取不同图像的高低频率进行混合，达到不同距离产生不同解释的效果。使用工具是MATLAB。本文主要包括以下3部分内容：图像过滤.图像混合.结论分析

2016-12-27 15:46:53 4034

omnizart音乐转录库的checkpoints

资源包括：由于网络原因，执行omnizart download-checkpoints的时候报错超时，所以需要手动下载。把checkpoint放到：你的conda环境\Lib\site-packages\omnizart\checkpoints 对应的文件夹中

2022-11-08

自然语言处理-6个写词人的打标数据

6个写词人['林夕', '方文山', '黄霑', '罗大佑', '李宗盛', '黄伟文']的歌词打标数据，用于歌词风格分类

2022-05-02

餐饮管理系统(Csharp源码)

餐饮快速开单，单台预订，快餐外买，批量预订等功能。

2011-06-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人