- 实用篇 -
文章平均质量分 83
多为脚本文件,减少日常的重复工作。
夏天|여름이다
人工智能研究员,致力于计算机视觉,自然语言处理,语音处理,多模态模型,强化学习等相关研究。
展开
-
问题解决 | RuntimeError: CUDA error: invalid device ordinalCUDA kernel errors
RuntimeError(运行时错误): CUDA 错误:设备序号无效CUDA 内核错误可能会在其他 API 调用中异步报告,因此下面的堆栈跟踪可能不正确。为便于调试,可考虑通过 CUDA_LAUNCH_BLOCKING=1。使用 `TORCH_USE_CUDA_DSA` 进行编译,以启用设备端断言。原创 2024-03-04 13:41:36 · 4899 阅读 · 0 评论 -
实用篇 | postman在AI模型中输入speech,text,image使用详解
postman在AI模型中输入speech,text,image使用详解原创 2024-01-30 15:48:35 · 1406 阅读 · 2 评论 -
模型量化 | Pytorch的模型量化基础
量化简介量化是指执行计算和存储的技术 位宽低于浮点精度的张量。量化模型 在张量上执行部分或全部操作,精度降低,而不是 全精度(浮点)值。这允许更紧凑的模型表示和 在许多硬件平台上使用高性能矢量化操作。与典型的 FP32 模型相比,PyTorch 支持 INT8 量化,模型大小减少 4 倍内存带宽减少 4 倍INT8 计算的硬件支持通常为 2 到 4 个 与 FP32 计算相比,速度快几倍量化主要是一种技术 加速推理,量化仅支持前向传递 运营商。PyTorch 支持多种量化深度学习模型的方法。原创 2023-12-27 09:45:22 · 2070 阅读 · 0 评论 -
Docker | 使用Docker创建自定义镜像封装人工智能项目和环境
使用Docker创建自定义镜像封装人工智能项目和环境图文详解~原创 2023-12-20 15:38:04 · 1191 阅读 · 0 评论 -
Docker | 将自己的docker镜像推送到docker hub[图文详情]
本文主要在Docker Hub上上传自己的镜像,可以按照以下图文步骤进行操作~原创 2023-12-20 15:12:27 · 3597 阅读 · 0 评论 -
实用篇 | 一文快速构建人工智能前端展示streamlit应用
本文主要描述了streamlit,看完本文可快速建立自己的项目app~原创 2023-12-08 09:43:51 · 8114 阅读 · 0 评论 -
实用篇 | 一文学会人工智能中API的Flask编写(内含模板)
在本文中,详细描述了在编写flask api中语法及语音文本图像模版案例等~原创 2023-12-05 08:58:04 · 1487 阅读 · 0 评论 -
实用篇 | 利用Flask+Postman为深度学习模型进行快速测试(超详细)
利用Flask+Postman为深度学习模型进行快速测试,以及算法中的一些实例,以后会更新一些新的模板~~原创 2023-12-04 15:48:31 · 660 阅读 · 0 评论 -
实用篇 | Base64详解及代码示例
Base64是一种二进制到文本的编码系统,它使用一组 64 个不同的 ASCII 字符将二进制数据传输为基于文本的格式。它通常用于对二进制数据进行编码,例如图像或音频文件。一般来说,编码是指将数据从一种格式转换为另一种格式的过程。Base64 编码是通过使用一组 64 个不同的 ASCII 字符表示二进制数据来实现的。当需要在本机不支持二进制数据的系统之间交换数据时,此编码特别有用。原创 2023-12-01 14:07:35 · 5638 阅读 · 0 评论 -
实用篇 | 关于Gradio快速构建人工智能模型实现界面,你想知道的都在这里
本文描述了gradio的各函数使用,以及关于图像,自然语言护理基于音频相关的所有实例模版~原创 2023-12-01 12:23:33 · 3409 阅读 · 1 评论 -
实用篇 | T-SNE可视化工具详情及代码示例
TSNE,降维方法之一。在简要说明之后,让我们举一个如何在Python中实际使用T-SNE的例子。降维在机器学习中非常重要。这是因为如果使用高维数据创建模型,则很容易欠拟合。换句话说,有太多无用的数据需要学习。您可以通过从各种数据中仅选择最重要的数据在模型中使用它,也可以使用多个数据创建新数据并使其低维。无论如何,有必要将此类高维数据转换为低维数据。这称为降维。(还有其他方法可以创建要素,例如“特征消除”和“特征选择”。原创 2023-11-22 15:38:28 · 9043 阅读 · 1 评论 -
Speech | .flac文件转换为.wav文件,并进行重采样(Python脚本)
把flac结尾的,替换为wav文件,然后对wav文件进行重采样(48000->22050),可以更换采样率,运行后保存为新的地址,所有文件都在同一文件夹下(保证能运行)。原创 2023-10-18 16:01:04 · 519 阅读 · 0 评论 -
React | 从头打造个人网站(超详细)
哈喽🤗,这篇博客从0开始教大家创建自己的网站,包含个人网站,商用网站等,并且提供模板类型,提供修改模块样本~最终效果那就开始吧👩💻👨💻。原创 2023-07-02 02:32:31 · 1818 阅读 · 2 评论 -
实用工具 | 语音文本对齐MFA的安装及使用
是一个用于将音频和文本进行对齐的工具。它可以用于语音识别、语音合成和发音研究等领域。MFA支持多种语言和语音,用户可以根据需要自定义训练模型。本博客介绍如何使用MFA对音频和文本进行对齐,其中使用的是MFA的最新版本(版本v2.2.12)。原创 2023-06-05 14:25:26 · 3651 阅读 · 2 评论 -
数据集 | 基于语音(Speech)/多模态(Multimodal)的情绪识别数据集,格式及下载
RAVDESS 包含 24 名专业演员(12 名女性,12 名男性),用中性的北美口音说出两个词汇匹配的陈述。文件名由 7 部分数字标识符组成(例如,03-01-06-01-02-01-12.wav)。情绪(01 = 中性,02 = 平静,03 = 快乐,04 = 悲伤,05 = 愤怒,06 = 恐惧,07 = 厌恶,08 = 惊讶)。情绪强度(01 = 正常,02 = 强烈)。模态(01 = 全 AV,02 = 仅视频,03 = 仅音频)。文件名示例:03-01-06-01-02-01-12.wav。原创 2023-05-12 10:22:17 · 7317 阅读 · 2 评论 -
实用篇 | huggingface的一些应用指导
本文主要介绍hugging Face(拥抱脸)的简单介绍以及常见用法,用来模型测试是个好的工具~如下图所示左边框是各项任务,包含多模态(Multimodal),计算机视觉(Computer Vision),自然语言处理(NLP)等,右边是各任务模型。本文测试主要有。原创 2023-05-11 13:04:31 · 4109 阅读 · 0 评论 -
Speech | openSMILE语音特征提取工具
openSMILE是一款以命令行形式运行的工具,通过配置config文件来提取音频特征。主要应用于语音识别、情感计算、音乐信息获取。2.0版本之后的openSMILE包括了openCV库,可以用于视频处理和视频特征提取。官网有linux和windows版本提供下载,windows可以不编译直接用,建议在命令行里指明 openSMILE 绝对路径。openSMILE的输入输出格式文件输入格式WEKA’s ARFF format.(由htk工具产生)原创 2023-11-22 10:01:07 · 940 阅读 · 0 评论 -
多模态 | 多模态中单模态中提取特征方法(代码)
在多模态任务中,有一种方法时在单模态中先各自提取各模态的特征,然后进行融合,本文主要实现各模态特征的提取。原创 2023-05-02 09:59:57 · 1697 阅读 · 0 评论 -
环境配置 | Win10 VSCode连接远程服务器里的docker容器
环境:win10, VS code, 远程服务器Ubuntu16.04(远程服务器上已经安装好了dockers),原创 2023-04-27 11:11:28 · 2542 阅读 · 0 评论 -
Docker | 解决docker 容器中csv文件乱码的情况
问题描述:在Ubuntu docker容器中,打开.csv文件时显示乱码问题如图。原创 2023-04-26 08:54:22 · 823 阅读 · 0 评论 -
问题解决 | Failed to initialize NVML: Driver/library version mismatch
Ubuntu20.04服务器上,一个docker容器正在训练模型,打开另外一个docker容器时,出现以下错误。原创 2023-04-25 14:43:17 · 5265 阅读 · 0 评论 -
tmux | 终端操作软件,解决深度学习中终端相关问题
tmux 一次可运行多个终端会话。或者在后台运行终端会话。当需要一次访问多个 ssh 会话或只是为了一个便利的流程管理时,这很有帮助。例如,可以在下载最新的系统更新时运行 htop,编辑配置文件并在一个 tmux 会话中重新启动服务。原创 2023-03-28 13:59:06 · 830 阅读 · 0 评论 -
数据处理 | 对于txt文件的操作(python脚本文件)
本博客主要是积攒日常所编写的一些关于txt的脚本文件,以便于以后遇到相关数据,可以加快事件处理。原创 2023-02-15 18:13:07 · 3363 阅读 · 0 评论 -
YOLO | 遍历文件夹(包括子目录)内指定json文件移动或者复制到新文件夹
也可以把json换成别的关键词,优点是简单快捷,缺点是未做异常处理,默认名称一样会将之前同文件的内容覆盖。把train文件夹下的(各个文件夹下)所有json文件移动到新文件夹,只移动json文件,移动文件后,原文件夹下的子目录文件夹不变。原创 2023-02-01 12:22:00 · 265 阅读 · 0 评论 -
Docker | docker安装portainer详细步骤
portainer是一款容器管理可视化界面,不想在虚拟中使用命令管理容器的小伙伴,可以选择安装portainer对容器进行管理,查看日志、启动、停止容器等非常方便。原创 2023-01-02 19:00:51 · 29107 阅读 · 0 评论 -
Docker | 深度学习中的docker看这一篇就够啦
Docker是一种相对使用较简单的容器,我们可以通过以下几种方式获取信息:1,通过docker run执行命令,或许返回信息2,通过docker logs去获取日志,做有针对性的筛选3,通过systemctl status docker查看docker服务状态4,通过journalctl -u docker.service查看日志。原创 2023-01-10 13:26:30 · 5014 阅读 · 0 评论 -
Docker | 利用远程服务器Linux,创建一个pytorch的容器,下载GitHub上的文件并实现Layout2img项目运行(Step-by-step)
本文通过MobaXterm登录到Linux服务器上操作:(docker 容器的创建,前提是已经安装好docker并处于运行状态,可通过docker ps命令查看docker是否运行)提示脚本文件内运行不了wget(Linux从网页下载文件命令),unzip(Linux解压zip文件命令)接着下载github上的项目(在win10上看好GitHub的项目,例如我的是layout2img)想要查看并修改文件,因为是新创建的容器,所以没有这些相关库,所以全部重新安装。创建容器后直接进入docker 容器内。原创 2022-12-30 19:23:54 · 684 阅读 · 0 评论 -
实用篇 | pdf文件转为docx文件(Python4行代码)
pdf文件转为docx文件(Python4行代码)!原创 2022-12-02 05:58:00 · 561 阅读 · 0 评论 -
markdown文档:一个简单标记语言的使用及GitHub实际应用
Markdown是一种轻量级的标记语言(lightweight markup language),并不是编程语言,它用于使用纯文本编辑器创建格式化文本。主要用于博客,即时消息,在线论坛,协作软件,文档页面和自述文件。Markdown 是一种最小的标记语言,可以使用普通的文本编辑器进行读取和编辑,但有专门设计的编辑器可以使用样式预览文件,这些样式适用于所有主要平台【1】。Markdown 是一种用来书写网页内容的方法。它实际上在使用我们在日常生活中用来书写和发送信息的纯文本格式来书写。原创 2022-11-04 20:13:43 · 2109 阅读 · 0 评论 -
实用篇 | 简单的可快速搭建的个人网站方式及工作原理
(添加准备好的html文件,如果没有写好的话,复制一个html文件也可以,以后再改)index.html就是主要主要页面啦。你的Github名称.github.io。点击add file=》upload。上传成功之后,就可以直接打开页面啦。...原创 2022-08-29 23:05:40 · 5280 阅读 · 0 评论 -
❀实用篇❀输入图片大小后,通道数变化和网络结构及参数量的打印,适用查询自己的网络参数大小
方法一:#pip install torchstatfrom torchstat import statimport torchvision.models as modelsmodel1 = models.resnet18()stat(model1, (3, 224, 224))model2 = models.mobilenet_v2()stat(model2, (3, 128, 128))print(model2)'''model3 = models.mobilenet_v2(原创 2022-05-27 17:57:19 · 812 阅读 · 0 评论