![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
简话系列
文章平均质量分 94
一碗白开水一
这个作者很懒,什么都没留下…
展开
-
简话S E G(持续更新)
FCNFCN-32XFCN-16XFCN-8X原创 2021-07-15 15:36:00 · 213 阅读 · 0 评论 -
简话A S R (持续更新)
概要语音预处理不管是进行什么参数分析以及采用什么分析方法,都需要一些预先的处理,如语音信号的数字化、语音信号的端点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。贯穿于语音分析全过程的是“短时分析技术”。语音识别中的端点检测(VAD)语音活动端点检测(VAD)已经是一个古老的话题,用于分离信号中语音信号和非语音信号,首先我们讲述VAD的三种做法:1,通过分帧,判断一帧...原创 2019-09-26 14:17:27 · 1152 阅读 · 1 评论 -
简 话 N L P(持续更新)
NLP主要研究问题:信息检索机器翻译文档分类问答系统信息过滤自动文摘信息抽取文本挖掘舆情分析机器写作语音识别原创 2019-08-23 12:54:57 · 207 阅读 · 0 评论 -
简话T T S(持续更新)
T T S,WavenetWavenet并不是一个端到端模型,由于它的输入并不是raw text而是经过处理的特征,因此它实际上只是代替了传统TTS pipeline的后端(回忆我们在之前文章中的概念,传统TTS pipeline由前端和后端组成)。Wavenet最大的成功之处就是使用dilated causal convolution技术来增加CNN的receptive field,从而提升了模型建模long dependency的能力,如下图所示:另外,Wavenet也使用了很多当时deep l原创 2020-08-03 11:03:02 · 681 阅读 · 0 评论 -
简话V O T(持续更新)
经典滤波:camshift、meanshift、Kalman filter、Optical flow原创 2020-01-15 14:02:24 · 960 阅读 · 0 评论 -
简话O B D(持续更新)
BACKGROUND在过去的十多年时间里,传统的机器视觉领域,通常采用特征描述子来应对目标识别任务,这些特征描述子最常见的就是 SIFT 和 HOG.而 OpenCV 有现成的 API 可供大家实现相关的操作计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割目前学术和工业界出现的目标检测算法分成3类:传统的目标检测算法:Cascade + HOG/DPM + Haar/...原创 2019-06-04 09:29:51 · 2192 阅读 · 0 评论 -
简话S R(持续更新)
目前基于深度学习(主要还是CNN)最为经典的论文应该是SRCNN[1]、FSRCNN[2]、ESPCN[3]、VDSR[4]、EDSR[5]、SRGAN[6]这几篇论文。一、从SRCNN到FSRCNNSRCNN是最早用CNN来进行超分辨率重建的论文(Kaiming He也参与其中),FSRCNN是SRCNN作者的改进,主要贡献在于直接原图像进行端对端的重建,在速度上也非常快,如图。二、ES...原创 2020-02-10 18:09:32 · 828 阅读 · 0 评论 -
简话V R/S V(持续更新)
文章目录声纹识别(VR-Voiceprint Recognition/SV-Speaker Verification)概述声纹识别(VR-Voiceprint Recognition/SV-Speaker Verification)概述声纹,是对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征(参数)所建立的语音模型的总称,而声纹识别是根据待识别语音的声纹特征识别该段语音所对应的...原创 2020-02-19 15:16:26 · 345 阅读 · 0 评论 -
简话G A N(持续更新)
建立两个网络netG和netD1) Generatefake_H = netG(var_L)loss1 = lossfun(fake_H, GT)loss2 = lossfun(netD(self.fake_H),True)loss_g=0.2*loss1+0.8*loss2loss_g.backward()2)Discriminationloss1 = lossfun(netD...原创 2020-03-17 15:09:40 · 152 阅读 · 0 评论