飞呀飞呀飞呀
码龄6年
关注
提问 私信
  • 博客:64,139
    64,139
    总访问量
  • 27
    原创
  • 388,347
    排名
  • 22
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2019-04-28
博客简介:

yin_fei_0825的博客

查看详细资料
个人成就
  • 获得31次点赞
  • 内容获得12次评论
  • 获得207次收藏
  • 代码片获得381次分享
创作历程
  • 8篇
    2022年
  • 10篇
    2021年
  • 19篇
    2020年
成就勋章
兴趣领域 设置
  • 人工智能
    语音识别机器学习深度学习神经网络自然语言处理tensorflowpytorch图像处理
  • 音视频
    语音识别音视频实时音视频
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

歌曲版本识别或者歌曲检索(总结)

歌曲版本识别或者歌曲检索(总结),shazam算法,landmark算法,bytecover
原创
发布博客 2022.07.24 ·
1526 阅读 ·
0 点赞 ·
1 评论 ·
3 收藏

pytorch保存模型的几种文件格式(pth, pt, pkl, rar)

pytorch保存模型的几种文件格式(pth, pt, pkl, rar)
原创
发布博客 2022.07.24 ·
4810 阅读 ·
1 点赞 ·
0 评论 ·
13 收藏

python中的并行处理(多线程)几种方式(Pool, Parallel, threading)

python中的并行处理(多线程)几种方式(Pool, Parallel, threading)
原创
发布博客 2022.07.24 ·
4265 阅读 ·
1 点赞 ·
0 评论 ·
12 收藏

torch.gather()用法

torch.gather()用法
原创
发布博客 2022.05.15 ·
360 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

python保存数据方式(npy, pkl, h5, pt, npz)

python保存数据方式(npy文件, pkl文件, h5文件, pt文件, npz文件)
原创
发布博客 2022.05.04 ·
8936 阅读 ·
7 点赞 ·
2 评论 ·
35 收藏

pytorch处理不同长度语音

深度学习处理不同长度语音信号解决方案
原创
发布博客 2022.05.04 ·
2409 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

语音信号处理——视频转换音频(FFmpeg)mp4转wav

利用FFmpeg将mp3,mp4换为wav格式。1, 利用终端命令方式import osfrom librosa.util import find_files# mp3转wavinput_dir = r"/mp4files"output_wav_dir = r"/output_wav"mp4s = find_files(input_dir,ext="mp4")for mp4 in mp4s: temp_wav_dir = os.path.basename(mp4).replace("mp4
原创
发布博客 2022.04.26 ·
5136 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

加载pickle文件, 找不到带名称的路径

两个原因1, 文件名错误2, 可能原因,在排除文件名错误后,可能由于文件名字太长,从而导致招不到路径import pickledef load_pickle(file_name): f = open(file_name, "rb") data = pickle.load(f) f.close() return data...
原创
发布博客 2022.03.28 ·
513 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

分布评价指标分析(切比雪夫距离,KL距离,余弦相似度,平方差和, 巴氏系数)python代码

切比雪夫距离def chebyshev_istance(a_list,b_list): return np.max(np.abs(a_list-b_list))KL距离def KLdiv(a_list, b_list): ''' 衡量一个分布相对于另一个分布的差异性;这个指标不能用作距离衡量,因为该指标不具有对称性 概率分布越相近,KL散度越小 ''' return scipy.stats.entropy(a_list,b_list)余弦相似度d
原创
发布博客 2021.12.02 ·
1574 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

pytorch加载不同size的文件(.npy, .wav, .jpg)进行padding

pytorch加载不同size的文件,然后进行padding以加载不同size的"XXX.numpy"文件为例;第一步:重写dataset,代码如下from torch.utils.data import DataLoader, Datasetclass train_dataset(Dataset): def __init__(self, train_path): super(train_dataset, self) self.all_list = find
原创
发布博客 2021.12.02 ·
1305 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

# pickle的用法和读写txt文件(python代码)

python中pickle用法import pickledef save_file(file_name,data): f = open(file_name,"wb") # 写 pickle.dump(data, f) f.close() def load_file(file_name): #读 f = open(file_name,'rb+') data = pickle.load(f) f.close() return datadata = load_file(file_name
原创
发布博客 2021.11.18 ·
1300 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

自注意力(self-attention)机制实现

转载文章https://blog.csdn.net/beilizhang/article/details/115282604
转载
发布博客 2021.11.15 ·
341 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用Opensmile提取语音MFCC特征

使用Opensmile提取语音MFCC特征1, 官网下载OpenSmile包,进入到"opensmile-2.3.0\bin\Win32"路径2, 打开cmd终端,然后输入SMILExtract_Release -C E:\software\opensmile-2.3.0\config\MFCC12_E_D_A.conf -I E:\data\012.wav -O E:\data\MFCC_2.htk3, 其数据结果是以htk格式保存,可以使用matlab相关函数进行打开查看。...
原创
发布博客 2021.11.15 ·
2441 阅读 ·
0 点赞 ·
2 评论 ·
1 收藏

#使用python批量提取OpenSmile关于情感特征集

转载文章https://blog.csdn.net/cg896406166/article/details/81066791
转载
发布博客 2021.11.14 ·
466 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

语音特征提取(语谱图Spectrogram,Fbank, MFCC, 及其delta-一阶差分)——python代码

导入相关包import osimport wavioimport numpy as npimport mathfrom matplotlib import pyplot as pltfrom scipy.fftpack import dct读取语音数据及主函数for wav in wavs: wav_dir = os.path.join(data_dir, wav) wav_data = wavio.read(wav_dir) data = wav_data.data sampl
原创
发布博客 2021.11.14 ·
5209 阅读 ·
3 点赞 ·
3 评论 ·
32 收藏

回声消除介绍大全

回声消除介绍大全转载文章:点击此处跳转
转载
发布博客 2021.08.12 ·
126 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

回声消除评价指标——ERLE, PESQ

回声消除评价指标——ERLE, PESQERLE(echo return loss enhancement):对于回声消除,单讲,只有回声信号,没有近端信号,判断输出结果是否能把回声信号消除掉。其值越大,证明效果越好。其中y(n)是输入信号,s(n)是输出信号。PESQ(perceptual evalution of speech quality):其值是越大越好。针对双讲(回声信号,和近端信号同时存在)。判断双讲下,计算PESQ方法:在python安装pypesq,安装方式如下:pip
原创
发布博客 2021.08.12 ·
5233 阅读 ·
3 点赞 ·
3 评论 ·
25 收藏

基于python(Tkinter)的语音情感识别模型界面

基于python(Tkinter)的语音情感识别模型界面界面左边是按键,右边是展示的选择文件或者录制文件,以及波形图、语谱图和显示结果。
原创
发布博客 2021.07.16 ·
398 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Pytorch 分布式简介,并行程序

Pytorch 分布式简介,并行程序转自:链接: https://blog.csdn.net/zwqjoy/article/details/89415933.
转载
发布博客 2020.07.27 ·
154 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python求语音信号语谱图、短时能量、短时过零率

python求语音信号语谱图、短时能量、短时过零率转自:链接: https://blog.csdn.net/YAOHAIPI/article/details/102986096?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522159551481619195239827172%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_
转载
发布博客 2020.07.23 ·
953 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多