自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 问答 (1)
  • 收藏
  • 关注

原创 【日拱一卒05】通用音频表示的自然语言监督(CLAP2023)

音频领域的最新研究侧重于学习能够推广到不同领域中各种下游任务的表示。2021 年音频表示整体评估 (HEAR)通过提供一个全面的设置来基准测试音频表示,朝着这个方向迈出了重要一步。这些模型使用监督学习、自监督学习或无监督学习在大型数据集 AudioSet (170 万个文件)上进行预训练。所有方法都必须经过额外的微调才能在给定的下游任务中使用其表示。【先介绍了研究趋势,即所有的方法都在朝着一个模型胜任全部任务方向发展,同时指出需要额外微调这个不足】零样本模型可以直接应用于任何任务,实现灵活性和泛化性。

2025-10-22 16:16:28 809

原创 【日拱一卒04】HTS-AT:一种用于声音分类和检测的层次化Token语义音频Transformer

音频分类是将音频样本映射到其对应标签的一项重要任务。最近,采用自注意力机制的Transformer模型已被应用于该领域。然而,现有的音频Transformer需要大量的GPU内存和较长的训练时间,同时依赖预训练的视觉模型来实现高性能,这限制了模型在音频任务中的可扩展性。为了解决这些问题,我们引入了HTS‐AT:一种具有分层结构的音频Transformer,以减小模型大小和训练时间。它进一步与token语义模块结合,将最终输出映射到类特征图,从而使模型能够进行音频事件检测 (即时间定位)。

2025-10-20 10:06:26 885

原创 【日拱一卒03】BEATS:基于声学分词器的音频预训练

文章名称:BEATS: Audio Pre-Training with Acoustic Tokenizers或会议信息:CCF-A摘要:近年来,自监督学习(SSL)在语言、视觉、语音和音频领域取得了巨大发展。尽管离散标签预测已被广泛应用于其他模态,但当前最先进的音频SSL模型仍 采用重建损失进行预训练。与重建损失相比,语义丰富的离散标签预测能够促 使SSL模型抽象出高级音频语义,并摒弃冗余细节,类似于人类感知。

2025-10-15 17:59:11 1594

原创 【日拱一卒02】用于枪声分类的深度频谱学习:CNN 架构和时间-频率表示的比较研究

文章名称:Deep Spectrogram Learning for Gunshot Classification: A Comparative Study of CNN Architectures and Time-Frequency Representations期刊分区:SCI计算机科学3区 IF 3.3摘要:枪声分类在公共安全、法医调查和智能监控系统等领域发挥着关键作用。

2025-10-14 17:33:57 1466

原创 【日拱一卒01】基于边缘的深度学习森林环境声音分类综述

森林生态系统在地球生命可持续存在中发挥着至关重要的作用。声学监视系统支持当局管 理对这类环境产生不利影响的人工和自然场景。本调查文章探讨了在边缘开发FSC系统的 主要方法,包括声音预处理技术、可用的标准数据集、最先进的深度学习模型以及不同的 硬件配置和评估指标。最后,我们为ESC领域提供了推荐技术,并讨论了未来研究方向中 的挑战,这将有助于该领域的研究人员和开发者。

2025-10-13 11:32:40 587

原创 远程连接Windows服务器,却需Linux环境?WSL+SSH端口转发完美解决方案

通过WSL + SSH端口转发,我们巧妙地绕过了Windows服务器无法直接运行Linux环境的限制,实现了在本地VSCode中无缝连接到服务器上的Ubuntu环境进行开发。这对于依赖特定Linux库的Python开发(尤其是AI、科学计算)、嵌入式开发、或者单纯更喜欢Linux工具链的用户来说,是一个高效且实用的解决方案。关键优势:保留原有Windows环境。WSL2 性能优异。直接使用VSCode Remote-SSH进行开发调试。服务器重启后通过自动化脚本保证连接可用。

2025-07-03 15:21:41 2308 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除