python
文章平均质量分 57
没用的阿鸡
不知咋办
展开
-
基于科大讯飞星火大模型Spark 4.0 Ultra的微信聊天机器人搭建教程
目前,办公场景中,员工需要与不同的人交谈,而微信作为其中的桥梁。随着如今工作越来越繁重,面对不同的人进行交谈已经是应接不暇,急需一个AI聊天机器人来帮助人们从繁忙的聊天中解放出来。原创 2024-09-19 11:09:00 · 428 阅读 · 0 评论 -
单通道说话人语音分离——DPRNN(Dual-Path Recurrent Neural Network)
近年来,基于深度学习的语音分离的研究证明了时域方法优于传统的基于时频的方法。与时频域方法不同,时域分离系统通常接收由大量时间步长组成的输入序列,这给极长序列的建模带来了挑战。传统的递归神经网络(RNNs)由于优化困难,对如此长的序列建模无效,而一维卷积神经网络(一维CNNs)在其接受域小于序列长度时,无法进行话语级序列建模。原创 2023-02-28 15:22:07 · 1645 阅读 · 0 评论 -
单通道说话人语音分离——Conv-TasNet(Convolutional Time-domain audio separation Network)
在真实的声学环境中,鲁棒的语音处理通常需要自动的语音分离。由于这一研究课题对语音处理技术的重要性,人们已经提出了许多方法来解决这一问题。然而,语音分离的准确性,特别是对新演讲者,仍然不够。原创 2023-02-23 10:14:48 · 5043 阅读 · 6 评论 -
自监督表征学习方法——BYOL(Bootstrap Your Own Latent)
学习良好的图像表示是计算机视觉中的一个关键挑战,因为它允许对下游任务进行有效的训练。许多不同的训练方法被提出来学习这种表征,通常依赖于视觉借口任务。 其中,最先进的对比方法是通过减少同一图像的不同增强视图的表示之间的距离和增加来自不同图像的增强视图的表示(负对)之间的距离来训练的。这些方法需要仔细处理负对,通过依赖大批量、内存库或定制的挖掘策略来检索负对。此外,它们的性能严重取决于图像增强的选择。原创 2023-02-13 14:18:45 · 1684 阅读 · 0 评论 -
在pytorch上利用GAN网络实现0-9数字生成
数据集来自torchvision的dataset的MNIST手写0-9数据集(28x28)生成器(Generator)和判别器(Discriminator)原创 2022-11-24 13:12:21 · 791 阅读 · 0 评论 -
python简单用opencv打开摄像头并用yolov5模型进行物体检测
python使用yolov5进行物体识别1.GitHub代码yolov5:https://github.com/ultralytics/yolov52.环境准备pip install -r requirements.txt3.示例代码import torch# Modelmodel = torch.hub.load('ultralytics/yolov5', 'yolov5s') # or yolov5m, yolov5l, yolov5x, custom# Imagesimg原创 2021-09-03 19:20:53 · 12970 阅读 · 25 评论 -
在python中用pyTorch搭建CNN神经网络实现数字(0~9)语音识别
在python中用pyTorch搭建CNN神经网络实现数字(0~9)语音识别1.收集训练数据speech_commands_v0.01.tar.gzhttp://download.tensorflow.org/data/speech_commands_v0.01.tar.gz自己用迅雷下载什么都行(推荐迅雷)2.准备环境①pycharm软件②cuda和cudnn(我的是11.3)③python(我的是3.9)④支持cuda的pytorch对于环境的准备,老样子,自己csdn查教程一大把。原创 2021-08-16 10:01:21 · 7411 阅读 · 34 评论 -
用python实现基于PANN(retrained Audio Neural Networks)的声音检测方法
用python实现基于PANN的声音事件检测方法1.PANN国外论文:《PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition》在本文中,我们提出了在大规模音频集数据集上训练的预先训练的音频神经网络(PANNs)。这些面板被转移到其他与音频相关的任务中。我们研究了由各种卷积神经网络建模的粒子的性能和计算复杂度。我们提出了一种称为波图-Logmel-CNN的架构,使用Log-mel谱图和波形作为原创 2021-07-28 21:00:03 · 5041 阅读 · 10 评论 -
用python实现语音端点检测(Voice Activity Detection,VAD)
用python实现语音端点检测(Voice Activity Detection,VAD)1.准备环境https://github.com/marsbroshok/VAD-python里面的vad.py文件2.具体代码from vad import VoiceActivityDetectorimport waveif __name__ == "__main__": load_file = "test.wav" save_file = "process.wav" # 获原创 2021-07-17 11:48:45 · 5909 阅读 · 6 评论 -
如何用python画出语谱图(spectrogram)和mel谱图(mel spectrogram)
如何用python画出语谱图(spectrogram)和mel谱图(mel spectrogram)1.准备环境①python②libsora③matplotlibNotes:pip install 直接一步到位2.具体代码①语谱图(spectrogram)import librosaimport numpy as npimport matplotlib.pyplot as pltpath = "./test.wav"# sr=None声音保持原采样频率, mono=False声原创 2021-07-15 10:41:48 · 12783 阅读 · 6 评论 -
python中libsora没有display模块真正解决方法(0.8.1)
python中libsora没有display模块真正解决方法(0.8.1)python报错module ‘librosa’ has no attribute ‘display’import librosa.display网上各种卸载退版本回0.7.2的都是愚蠢的方法仔细看librosa的官方文档0.8.1是有display模块的...原创 2021-07-15 10:25:37 · 1328 阅读 · 0 评论 -
python实现Logmmse声音降噪算法
python实现Logmmse声音降噪算法1.所需环境pip install logmmsepip install wavepip install numpy2.具体代码import logmmseimport waveimport numpy as npif __name__ == '__main__': # out = logmmse.logmmse_from_file('B000_0000.wav') # print(out) # 读取音频 pa原创 2021-07-13 20:38:16 · 3696 阅读 · 0 评论 -
在python中用pyTorch实现数字(0~9)语音识别
基于python的数字(0~9)语音识别1.收集训练数据speech_commands_v0.01.tar.gzhttp://download.tensorflow.org/data/speech_commands_v0.01.tar.gz自己用迅雷下载什么都行(推荐迅雷)2.准备环境①pycharm软件②cuda和cudnn(我的是11.3)③python(我的是3.9)④支持cuda的pytorch对于环境的准备,老样子,自己csdn查教程一大把。推荐不要用conda,直接全pip原创 2021-07-03 09:44:30 · 8252 阅读 · 17 评论 -
Python的OpenCV的cv2.imread(path)返回None问题解决方法
Python的OpenCV的cv2.imread(path)返回None却不报错问题解决方法cv2.imread(path)我的原因path这个后面多了\n,然后就一直返回None。解决方法:cv2.imread(path.replace("\n","")),去掉\n就可以读到读取图片了希望对你们有所帮助!!!...原创 2020-04-08 16:47:13 · 1693 阅读 · 1 评论 -
python+opencv+opencv-contrib 人脸识别
python+opencv+opencv-contrib 人脸识别1.环境安装①python3.7②opencv③opencv-contrib2.准备样本大概准备5-6个人的人脸图,每个人大概10-20副图这里我上网百度随便找了爱情公寓里面的人当材料,如若侵权,立刻删除3.训练样本def encode_face(path_name): # grab the paths ...原创 2020-02-22 18:03:16 · 866 阅读 · 1 评论