- 博客(39)
- 收藏
- 关注
原创 python杂记
目录1、argparse模块2、logging 模块3、读写操作:with open() as f:with open('data.txt', 'w') as f:With codecs.open()4、python使用json的格式5、Python 内置类型全解析1 Lists 列表型列表声明列表索引、切片列表拼接在列表中检索值从列表中删除元素6、if-else的多种写法7、Python常用模块之os.path——文件及路径操作os.p.
2022-05-26 13:07:30 685
翻译 一种基于卡尔曼滤波的语音增强方法
本文考虑了只有损坏的语音信号可供处理时的语音增强问题。为此,研究了卡尔曼滤波方法,并与维纳滤波方法进行了比较。卡尔曼滤波方法的性能明显优于维纳滤波方法。提出了一种延迟卡尔曼滤波方法,进一步提高了卡尔曼滤波的语音增强性能。
2023-04-02 15:56:58 799
翻译 Sound Spaces 2.0: A Simulation Platform for Visual-Acoustic Learning(2022)
SoundSpaces2.0:一个用于视觉-声学学习的模拟平台
2022-08-16 13:37:09 1762
翻译 Sound Spaces: Audio-Visual Navigation in 3D Environments(2020)
声音空间:三维环境中的视听导航(2020)
2022-08-09 22:48:28 1112
翻译 Look, Listen, and Act: Towards Audio-Visual Embodied Navigation(2020)
看、听和行动:面向视听体现的导航(2020)
2022-08-06 22:57:35 205
翻译 Seeing wake words: Audio-Visual Keyword Spotting(2020)
看到唤醒词:视听关键字定位()2020
2022-07-31 20:07:32 371
翻译 AUDIO-VISUAL KEYWORD SPOTTING BASED ON MULTIDIMENSIONAL CONVOLUTIONAL NEURAL NETWORK (2018)
基于多维卷积神经网络的视听关键字定位(2018)
2022-07-30 14:46:07 130
翻译 Masked Label Prediction: Unified Message Passing Model for Semi-Supervised Classification(2021)
掩码标签预测:用于半监督分类的统一消息传递模型(2021)
2022-07-23 23:09:34 1438 2
翻译 An End-to-End Network for Emotion-Cause Pair Extraction (2021)
情绪原因对提取的端对端网络(2021) :仅使用文本模态来解决情感识别任务
2022-07-22 19:06:57 433
翻译 Modeling Relational Data with Graph Convolutional Networks(2017)
用图卷积网络建模关系数据(2017)
2022-07-21 23:13:13 836
翻译 cogmen: contextualized gnn based multimodal emotion recognition(2022)
cogmen:基于语境gnn的多模式情感识别(2022)
2022-07-20 22:08:25 1249 2
翻译 Speech Emotion Recognition with Multi-task Learning(2021)
多任务学习模式下的语音情绪识别的研究(2021)
2022-07-17 21:38:23 1979 2
翻译 Wav2KWS: Transfer Learning From Speech Representations for Keyword Spotting(2021)
Wav2KWS:基于语音表示的迁移学习用于关键词识别(2021)
2022-07-09 17:58:38 498
翻译 INTERACTIVE FEATURE FUSION FOR END-TO-END NOISE-ROBUST SPEECH RECOGNITION(2022)
用于端到端噪声语音识别的鲁棒交互特征融合(2022)
2022-07-05 22:28:52 435 1
翻译 A Novel Lip Descriptor for Audio-Visual Keyword Spotting Based on Adaptive Decision Fusion(2016)
一种基于自适应决策融合的视听关键字识别嘴唇描述符(2016)
2022-07-04 16:17:37 229
翻译 A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement(2018)
一种用于实时语音增强的卷积递归神经网络(2018)
2022-05-28 18:37:46 948
原创 神经网络大总
全连接层(fully connected layers,FC)全连接的核心操作就是矩阵向量乘积: y=Wx,就是一个特征空间变换(线性变换),把有用信息提取整合。所有各种层连接到一起叫做神经网络,如果这个层只有全连接层,那么这个网络就是全连接神经网络。(全连接神经网络的主要作用是分类),下面是全连接神经网络的几种:在 CNN中,全连接常出现在最后几层,用于对前面设计的特征做加权和。提取全图范围特征,最终实现分类。(全连接参数量大,但是如果特征图压缩足够小再做全连接,...
2022-05-25 12:18:14 54
翻译 DEEP RESIDUAL LEARNING FOR SMALL-FOOTPRINT KEYWORD SPOTTING(2018)
基于深度残差学习的小足迹关键词识别(2018)
2022-05-24 22:45:00 186
翻译 IDEAL RATIO MASK ESTIMATION USING DEEP NEURAL NETWORKS FOR ROBUST SPEECH RECOGNITION(2013)
利用深度神经网络估计理想比率掩码进行鲁棒语音识别(2013)
2022-05-23 12:15:13 499
翻译 An Efficient Joint Training Framework for Robust Small-Footprint Keyword Spotting(2020)
一种用于鲁棒性小足迹关键词识别的高效联合训练框架(2020)
2022-05-20 02:00:00 401
翻译 Adaptive Decision Fusion for Audio-Visual Speech Recognition(2008)
Adaptive Decision Fusion for Audio-Visual Speech Recognition(2008)视听语音识别中的自适应决策融合
2022-05-17 04:15:00 552
翻译 MAX-POOLING LOSS TRAINING OF LONG SHORT-TERM MEMORY NETWORKS FOR SMALL-FOOTPRINT KEYWORD(2017)
长-短期记忆网络的最大池损失训练用于低资源关键词识别(2017)
2022-05-09 12:54:25 473
翻译 CONVMIXER: FEATURE INTERACTIVE CONVOLUTION WITH CURRICULUM LEARNING FOR SMALL FOOTPRINT AND...(2021)
CONVMIXER:具有课程学习的特征交互式卷积,适用于小足迹和有噪声的远场关键字识别(2021)
2022-05-07 13:41:28 439
翻译 Broadcasted Residual Learning for Efficient Keyword Spotting(2021)
广播残差学习用于有效的关键词识别(2021)
2022-05-03 22:25:15 855
原创 多模态汇总
文献名 发表年份/代码 数据集 网络 输入 输出 新思想 基于层次注意的视频情感识别多模态融合网络 2021/无 MHED 基于分层注意的多模态融合网络(HAMF):由CNN和Attention组成 视频帧 不同模态的情绪分数 ...
2022-05-01 17:57:37 264
翻译 End-to-end keyword search system based on attention mechanism and energy scorer for low ...(2021)
基于注意力机制和(用于低资源语言的)能量评分器的端到端关键词搜索系统(2021)
2022-04-28 05:00:00 424
翻译 AGQA: A Benchmark for Compositional Spatio-Temporal Reasoning
AGQA:一个组合时空推理的基准
2022-04-25 13:35:36 486
翻译 Hello Edge: Keyword Spotting on Microcontrollers(2017)
Hello Edge:微控制器上的关键字定位(2017)
2022-04-23 11:43:55 309 2
翻译 Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in Videos
(用于视频中的目标物指代理解的)(具有语义注意的)联合接地网络
2022-04-18 17:22:27 1305 1
翻译 VLM: Task-agnostic Video-Language Model Pre-training for Video Understanding
VLM: Task-agnostic Video-Language Model Pre-training for Video UnderstandingVLM:用于视频理解的任务无关的视频语言模型预训练
2022-04-16 09:00:00 1037 1
翻译 Predicting Emotions in User-Generated Video
Predicting Emotions in User-Generated Video预测在用户生成的视频中的情绪
2022-04-15 13:35:18 327
翻译 Hierarchical Attention-Based Multimodal Fusion Network for Video Emotion Recognition
Hierarchical Attention-Based Multimodal Fusion Network for Video Emotion Recognition基于层次注意的视频情感识别多模态融合网络
2022-04-15 13:28:36 1102 4
翻译 Emotion Expression With Fact Transfer for Video Description基于事实传递的视频描述情感表达
Emotion Expression With Fact Transfer for Video Description基于事实传递的视频描述情感表达
2022-04-15 13:19:48 586
翻译 Deep Learning Approach for Aspect-Based Sentiment Classification: A Comparative Review
基于方面的情感分类的深度学习方法:对比综述
2022-04-14 10:58:04 532
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人