自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

afanti_1的博客

秃头记录

  • 博客(39)
  • 收藏
  • 关注

原创 python杂记

目录1、argparse模块2、logging 模块3、读写操作:with open() as f:with open('data.txt', 'w') as f:With codecs.open()4、python使用json的格式5、Python 内置类型全解析1 Lists 列表型列表声明列表索引、切片列表拼接在列表中检索值从列表中删除元素6、if-else的多种写法7、Python常用模块之os.path——文件及路径操作os.p.

2022-05-26 13:07:30 685

翻译 一种基于卡尔曼滤波的语音增强方法

本文考虑了只有损坏的语音信号可供处理时的语音增强问题。为此,研究了卡尔曼滤波方法,并与维纳滤波方法进行了比较。卡尔曼滤波方法的性能明显优于维纳滤波方法。提出了一种延迟卡尔曼滤波方法,进一步提高了卡尔曼滤波的语音增强性能。

2023-04-02 15:56:58 799

原创 维纳滤波法

维纳滤波

2022-11-16 21:15:17 154

原创 谱减法()

谱减法

2022-11-16 21:04:41 293

翻译 Semantic Audio-Visual Navigation(2021)

语义视听导航(2021)

2022-08-16 18:06:39 206

翻译 Sound Spaces 2.0: A Simulation Platform for Visual-Acoustic Learning(2022)

SoundSpaces2.0:一个用于视觉-声学学习的模拟平台

2022-08-16 13:37:09 1762

翻译 Sound Spaces: Audio-Visual Navigation in 3D Environments(2020)

声音空间:三维环境中的视听导航(2020)

2022-08-09 22:48:28 1112

翻译 Look, Listen, and Act: Towards Audio-Visual Embodied Navigation(2020)

看、听和行动:面向视听体现的导航(2020)

2022-08-06 22:57:35 205

翻译 Seeing wake words: Audio-Visual Keyword Spotting(2020)

看到唤醒词:视听关键字定位()2020

2022-07-31 20:07:32 371

翻译 AUDIO-VISUAL KEYWORD SPOTTING BASED ON MULTIDIMENSIONAL CONVOLUTIONAL NEURAL NETWORK (2018)

基于多维卷积神经网络的视听关键字定位(2018)

2022-07-30 14:46:07 130

翻译 Lip Reading Sentences in the Wild(2017)

在野外的唇读句子(2017)

2022-07-27 22:07:11 881 1

翻译 Masked Label Prediction: Unified Message Passing Model for Semi-Supervised Classification(2021)

掩码标签预测:用于半监督分类的统一消息传递模型(2021)

2022-07-23 23:09:34 1438 2

翻译 An End-to-End Network for Emotion-Cause Pair Extraction (2021)

情绪原因对提取的端对端网络(2021) :仅使用文本模态来解决情感识别任务

2022-07-22 19:06:57 433

翻译 Modeling Relational Data with Graph Convolutional Networks(2017)

用图卷积网络建模关系数据(2017)

2022-07-21 23:13:13 836

翻译 cogmen: contextualized gnn based multimodal emotion recognition(2022)

cogmen:基于语境gnn的多模式情感识别(2022)

2022-07-20 22:08:25 1249 2

翻译 Speech Emotion Recognition with Multi-task Learning(2021)

多任务学习模式下的语音情绪识别的研究(2021)

2022-07-17 21:38:23 1979 2

翻译 Wav2KWS: Transfer Learning From Speech Representations for Keyword Spotting(2021)

Wav2KWS:基于语音表示的迁移学习用于关键词识别(2021)

2022-07-09 17:58:38 498

翻译 基于 wav2vec预训练的样例关键词识别(2021)

基于 wav2vec预训练的样例关键词识别(2021)

2022-07-06 19:14:18 877

翻译 INTERACTIVE FEATURE FUSION FOR END-TO-END NOISE-ROBUST SPEECH RECOGNITION(2022)

用于端到端噪声语音识别的鲁棒交互特征融合(2022)

2022-07-05 22:28:52 435 1

翻译 A Novel Lip Descriptor for Audio-Visual Keyword Spotting Based on Adaptive Decision Fusion(2016)

一种基于自适应决策融合的视听关键字识别嘴唇描述符(2016)

2022-07-04 16:17:37 229

翻译 A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement(2018)

一种用于实时语音增强的卷积递归神经网络(2018)

2022-05-28 18:37:46 948

原创 神经网络大总

全连接层(fully connected layers,FC)全连接的核心操作就是矩阵向量乘积: y=Wx,就是一个特征空间变换(线性变换),把有用信息提取整合。所有各种层连接到一起叫做神经网络,如果这个层只有全连接层,那么这个网络就是全连接神经网络。(全连接神经网络的主要作用是分类),下面是全连接神经网络的几种:在 CNN中,全连接常出现在最后几层,用于对前面设计的特征做加权和。提取全图范围特征,最终实现分类。(全连接参数量大,但是如果特征图压缩足够小再做全连接,...

2022-05-25 12:18:14 54

翻译 DEEP RESIDUAL LEARNING FOR SMALL-FOOTPRINT KEYWORD SPOTTING(2018)

基于深度残差学习的小足迹关键词识别(2018)

2022-05-24 22:45:00 186

翻译 IDEAL RATIO MASK ESTIMATION USING DEEP NEURAL NETWORKS FOR ROBUST SPEECH RECOGNITION(2013)

利用深度神经网络估计理想比率掩码进行鲁棒语音识别(2013)

2022-05-23 12:15:13 499

翻译 An Efficient Joint Training Framework for Robust Small-Footprint Keyword Spotting(2020)

一种用于鲁棒性小足迹关键词识别的高效联合训练框架(2020)

2022-05-20 02:00:00 401

翻译 Adaptive Decision Fusion for Audio-Visual Speech Recognition(2008)

Adaptive Decision Fusion for Audio-Visual Speech Recognition(2008)视听语音识别中的自适应决策融合

2022-05-17 04:15:00 552

翻译 MAX-POOLING LOSS TRAINING OF LONG SHORT-TERM MEMORY NETWORKS FOR SMALL-FOOTPRINT KEYWORD(2017)

长-短期记忆网络的最大池损失训练用于低资源关键词识别(2017)

2022-05-09 12:54:25 473

翻译 CONVMIXER: FEATURE INTERACTIVE CONVOLUTION WITH CURRICULUM LEARNING FOR SMALL FOOTPRINT AND...(2021)

CONVMIXER:具有课程学习的特征交互式卷积,适用于小足迹和有噪声的远场关键字识别(2021)

2022-05-07 13:41:28 439

翻译 Broadcasted Residual Learning for Efficient Keyword Spotting(2021)

广播残差学习用于有效的关键词识别(2021)

2022-05-03 22:25:15 855

原创 多模态汇总

文献名 发表年份/代码 数据集 网络 输入 输出 新思想 基于层次注意的视频情感识别多模态融合网络 2021/无 MHED 基于分层注意的多模态融合网络(HAMF):由CNN和Attention组成 视频帧 不同模态的情绪分数 ...

2022-05-01 17:57:37 264

翻译 End-to-end keyword search system based on attention mechanism and energy scorer for low ...(2021)

基于注意力机制和(用于低资源语言的)能量评分器的端到端关键词搜索系统(2021)

2022-04-28 05:00:00 424

翻译 AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning

AGQA:一个组合时空推理的基准

2022-04-25 13:35:36 486

翻译 Hello Edge: Keyword Spotting on Microcontrollers(2017)

Hello Edge:微控制器上的关键字定位(2017)

2022-04-23 11:43:55 309 2

翻译 Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in Videos

(用于视频中的目标物指代理解的)(具有语义注意的)联合接地网络

2022-04-18 17:22:27 1305 1

翻译 VLM: Task-agnostic Video-Language Model Pre-training for Video Understanding

VLM: Task-agnostic Video-Language Model Pre-training for Video UnderstandingVLM:用于视频理解的任务无关的视频语言模型预训练

2022-04-16 09:00:00 1037 1

翻译 Predicting Emotions in User-Generated Video

Predicting Emotions in User-Generated Video预测在用户生成的视频中的情绪

2022-04-15 13:35:18 327

翻译 Hierarchical Attention-Based Multimodal Fusion Network for Video Emotion Recognition

Hierarchical Attention-Based Multimodal Fusion Network for Video Emotion Recognition基于层次注意的视频情感识别多模态融合网络

2022-04-15 13:28:36 1102 4

翻译 Emotion Expression With Fact Transfer for Video Description基于事实传递的视频描述情感表达

Emotion Expression With Fact Transfer for Video Description基于事实传递的视频描述情感表达

2022-04-15 13:19:48 586

翻译 Deep Learning Approach for Aspect-Based Sentiment Classification: A Comparative Review

基于方面的情感分类的深度学习方法:对比综述

2022-04-14 10:58:04 532

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除