语音、神经网络共同学习
文章平均质量分 79
学习神经网络,记录点滴知识。
xinruoqianqiu
虽然从事工作好多年了,但感觉自己还是个菜鸟,从基础做起,做大做强。
展开
-
语音---波束
天线方向图描述了天线在空间中不同方向的辐射或接收能力,对于定向天线(有一个或多个最大方向的天线),其主波束指向最大辐射或接收方向。通信卫星可能使用全球波束、区域波束、点波束、多波束或成形波束等,而遥感卫星除了采用固定波束外,还可能有可调波束,以使不同地理特征的服务区处于增益最大区域(辐射方向图的主波瓣)内。此外,波束成形技术也是一种重要的信号处理技术,它通过对多天线阵元接收到的各路信号进行加权合成,形成所需的理想信号,从而在天线方向图上形成规定指向上的波束。原创 2024-07-26 09:15:00 · 387 阅读 · 0 评论 -
Beam Search解码
Beam Search(束搜索)是一种在搜索空间中寻找最优解的算法。它常用于自然语言处理任务中,如机器翻译和语言生成。Beam Search通过在每个时间步选择概率最高的一组候选解来进行搜索,以此来寻找最有可能的解。Beam Search的原理如下:(1)首先,根据模型的输出概率分布,选择概率最高的K个候选解作为初始解集。(2)在每个时间步,对于每个候选解,根据模型的输出概率分布,生成K个新的候选解。原创 2023-12-30 15:05:59 · 1468 阅读 · 1 评论 -
Token Passing解码
然后将state-id=2加入到queue中,再次遍历queue中,由于state-id=2有一个输入标签为零的出边3(0,0,0.3,3),由于state-id=3上没有token,新建token4(0,0,0.4,token3),这里current token中就有三个元素state-id=1 token2 cost=0、state-id=2 token3 cost=0.1和state-id=3 token4 cost=0.4。这里只有一个元素state-id:0。这里使用剪枝操作,后面会更好理解。原创 2023-12-24 14:46:16 · 1092 阅读 · 1 评论 -
Viterbi算法
Viterbi算法是一种动态规划算法,用于寻找最有可能产生观测事件序列的--viterbi路径--隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。在语音识别中,声音信号作为观察到的事件序列,而文本字符串被看作是隐含的产生声音信号的原因,因此可对声音信号应用维特比算法寻找最有可能的文本字符串。Viterbi算法解决的是栅栏(Lattice)图的最短路径问题,图的节点按列组织,每一列的节点只能和相邻的列的节点相连,不能跨列相连,节点之间有着不同的距离。Viterbi。原创 2023-12-17 17:12:36 · 2167 阅读 · 1 评论 -
神经网络基础--持续更新
也就是如何把损失值从神经网络的最后面传递到最前面。如最基础的梯度下降算法,随机梯度下降算法,批量梯度下降算法,带动量的梯度下降算法,Adagrad,Adadelta,Adam等。度量神经网络的输出预测值与实际值之间的差距的一种方式。常见的损失函数包括:最小二乘损失函数、交叉熵损失函数、回归中使用的smooth L1损失函数等。将神经网络上一层的输入,经过神经网络层的非线性变换转换后,通过激活函数,得到输出。常见的激活函数包括:sigmoid, tanh, relu等。原创 2023-12-11 22:18:22 · 324 阅读 · 0 评论 -
语音基础知识--持续更新
这种处理可以包括混响(Reverberation)、延迟(Delay)、回声(Echo)、失真(Distortion)等,使得声音听起来更加饱满、有空间感或具有特定的效果。(3)波形:直接反映了语音信号的波形特征,如音节的起始和结束、声音的强弱变化等。(2)纵轴:信号的幅度(或功率),表示该频率成分在语音信号中的强度。(2)纵轴:信号的幅度(振幅),表示声音信号的强弱。4.2、频域图。4.3、频谱图。原创 2023-12-10 21:39:16 · 431 阅读 · 1 评论 -
LSTM解读
LSTM的核心是三个门:输入门、遗忘门和输出门。输入门控制新信息的输入,遗忘门控制旧信息的保留,输出门控制输出的信息。上下两层的LSTM计算应有时间先后顺序,即下层是t1、t2、t3时刻,上层将是接着t4、t5、t6时刻才开始。(1)假设有3个字的序列【“早”“上”“好”】要经过LSTM处理,每个序列由20个元素组成的列向量构成,所以input size就为20。通过遗忘门、输入门、输出门可以让LSTM有能力去学会衡量长短期记忆的能力。LSTM:长短期记忆网络。LSTMP:压缩LSTM。原创 2023-12-09 18:54:02 · 2273 阅读 · 0 评论