自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (2)
  • 收藏
  • 关注

原创 PyTorch for Audio + Music Processing(8/9/10) :基于CNN的模型构建/训练/推理

本系列最后一部分:urban sound音频分类神经网络模型的搭建和训练

2022-12-17 15:56:26 905 3

原创 PyTorch for Audio + Music Processing(2/3/4/5/6/7) :构建数据集和提取音频特征

本系列本来打算每一章都写笔记记录下来,不过看来几个视频之后,发现2,3其只是在普及torch以及复现基础手写字体识别的例子,与torchaudio和音频处理关系不大,就跳过,感兴趣的可以直接看代码。

2022-11-23 11:04:04 1725 1

原创 PyTorch for Audio + Music Processing(1) :Course Overview(课程大纲)

本系列文章为作者Valerio Velardo在youtube的频道 The Sound of AI发布的PyTorch for Audio + Music Processing系列的教程笔记,适合快速入门如何使用pytorch处理音频和音乐,课程中从处理音频数据、构建数据集和dataloader,到构建一个简单的分类器并完成训练和预测,都有比较详细的讲解。

2022-11-23 11:02:49 478

转载 基于mklink创建目录链接解决conda环境占用C盘空间太大的问题

基于mklink创建目录链接解决conda环境占用C盘空间太大的问题

2022-11-14 12:06:15 776

原创 音乐转录(AMT)库Omnizart论文笔记及实践

自动音乐转录(AMT),从原始音频推断音符,是音乐理解核心的一项具有挑战性的任务。Omnizart库是一个用于AMT任务的python库,收集了目前各种乐器转录的SOTA模型,并提供了统一的命令行接口。本文记录了论文的笔记以及在简单鼓节奏的测试。

2022-11-08 11:31:51 851

原创 在LMMS中导入mid文件并播放

LMMS下载音色并播放mid文件

2022-11-05 15:58:34 643

原创 【mido之架子鼓编曲】

midi是基于事件的通用音乐表现格式,是计算机音乐的基础数据结构。mido为用于解析和生成Midi文件的python库,本文以mido库来生成常见的架子鼓节奏。尝试了mido来生成鼓的基本节奏,可以作为计算机混音,编曲,转录的基础。

2022-11-04 12:20:38 1208 1

原创 【 基于transformer的歌词分类】

从0到1实现基于transformer的歌词风格分类

2022-05-02 16:20:21 657

原创 搭建基于nginx+gunicorn+flask的ai服务平台

概念:wsgi:Web服务器网关接口(Python Web Server Gateway Interface,缩写为WSGI)是为Python语言定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口。Flask:python web微服务开发框架gunicorn:在unix系统运行的wsgi服务器nginx:http和反向代理服务器(客户端无法感知代理的存在)总体...

2020-06-30 17:38:12 444

原创 基于flask+pytorch的yolov3目标检测服务开发

背景:以yolov3为例子,构建基于flask的微服务架构,对外提供算法能力。制定服务的接口规范,后续有新的算法模型,也可以按照此例子的做法,快速地部署。概念:wsgi:Web服务器网关接口(Python Web Server Gateway Interface,缩写为WSGI)是为Python语言定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口。Flask:py...

2020-05-07 10:23:08 3081 1

转载 CS231n: Convolutional Neural Networks for Visual Recognition

课程介绍Computer Vision has become ubiquitous in our society, with applications in search, image understanding, apps, mapping, medicine, drones, and self-driving cars

2017-03-07 13:46:17 403

原创 CS131-PA2 通过聚类实现前/背景分离 Foreground-Background Segmentation via Clustering

通过聚类实现前/背景分离图像背景分离也称图像切割,原理是利用聚类算法将图像进行聚类,聚为不同的若干个类,这些类别即包含了图像的前景和背景。此项目包含以下几个方面:聚类方法:实现K-Means和Hierarchical Agglomerative算法点特征向量:实现ComputePositionColorFeatures(颜色和位置)方法和特征归一化不同参数实验并分析

2017-01-01 17:14:04 1618 1

原创 CS131-PA1 全景拼接Panorama Stitching

全景拼接(Panoramic stitching)是机器视觉应用比较早也比较成功的方向,目前有大量的应用,比如google的街道全景图,手机的全景图像拼接,各种拼接软件(Photosynth and AutoStitch)等等.本文方法是通过计算不同图像sift特征,并计算出图像之间的仿射关系,从而拼接出全景图像

2016-12-31 13:59:11 3383

转载 斯坦福视觉课程CS131简介

Stanford UniversityCS 131 Computer Vision: Foundations and ApplicationsFall 2015-2016Announcements:    •    Welcome to CS131!    •    Schedule information may change during the qua

2016-12-31 13:42:05 10038 2

转载 布朗大学视觉课程CS143简介

CS 143 Introduction to Computer VisionFall 2013, MWF 1:00 to 1:50, Kasser House, Foxboro AuditoriumInstructor: James HaysTAs: Hari Narayanan (HTA), Libin "Geoffrey" Sun, Greg Yauney, Bryce Aebi,

2016-12-31 13:16:48 1033 3

原创 CS143-project4基于滑窗的人脸检测 Face detection with a sliding window

ttt

2016-12-29 17:37:14 3337 1

原创 CS143-project3 基于bag of words 的场景识别 Scene Recognition with Bag of Words

本项目实现两种不同的图像表示——小图像和SIFT特征包,以及两种不同的分类技术——最近邻和线性SVM。通过试验得到准确率是小图像和最近邻分类器 (准确率20.50%).SIFT表示包和最近邻分类器 (准确率49.99%).SIFT表示包和线性SVM分类器 (准确率68.10%).

2016-12-28 11:23:38 1143 1

原创 CS143-project2 局部特征匹配 Local Feature Matching

本项目通过harris算法对图像进行兴趣点的检测和提取。然后计算兴趣点周围4*4区域的8个方向特征向量,最后对获取到的特征向量对进行匹配。本算法对旋转,缩放,亮度变化保持一定程度的稳定性。环境:操作系统:WIN7实现平台:MATLAB2014a  本项目主要包括以下4部分:特征点检测和提取(harris).生成特征算子(sift).图像匹配(match).实验DEMO

2016-12-27 17:26:08 4318 5

原创 CS143-project1 图像过滤与图像混合Image Filtering and Hybrid Images

本文主要通过线性过滤器原理对图像进行过滤,并根据自定义的过滤器截取不同图像的高低频率进行混合,达到不同距离产生不同解释的效果。使用工具是MATLAB。本文主要包括以下3部分内容:图像过滤.图像混合.结论分析

2016-12-27 15:46:53 3998

omnizart音乐转录库的checkpoints

资源包括: 由于网络原因,执行omnizart download-checkpoints的时候报错超时,所以需要手动下载。 把checkpoint放到:你的conda环境\Lib\site-packages\omnizart\checkpoints 对应的文件夹中

2022-11-08

自然语言处理-6个写词人的打标数据

6个写词人['林夕', '方文山', '黄霑', '罗大佑', '李宗盛', '黄伟文']的歌词打标数据,用于歌词风格分类

2022-05-02

餐饮管理系统(Csharp源码)

餐饮快速开单,单台预订,快餐外买,批量预订等功能。

2011-06-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除