- 博客(19)
- 资源 (20)
- 收藏
- 关注
原创 强化学习小记
如果程序没有收敛, 奖励会一直往外扩展,直到扩展出去的奖励超过衰减率。如果只有正向奖励,相当于记录了统计上的最短距离。如果有负向奖励或者多种奖励,相当于记录了当前状态做当前操作的统计收益。每一个状态都是当前操作得到的奖励,加上他做当前操作后到达的下一状态的奖励值衰减回来。相当于是迭代求解贝尔曼方程,将最后结果按学习率和衰减率扩散到所有状态。
2023-09-07 17:50:38 67
原创 LORA更新
1. 因为在大模型损失梯度下降过程中,权重的变化矩阵基本是低秩矩阵。所以可以将权重变化做矩阵分解,权重变化变成了两个小的矩阵相乘。神经网络的每一个连接层都可以做这样一个分解。2. 在训练过程中,每一次权重更新都更新到了这两个小矩阵上,这样在不动原大模型矩阵的基础上,加上这两个小矩阵相乘的输出结果,即相当于对原模型进行了微调。
2023-08-23 11:33:14 76
原创 Transformer
1. transformer与RNN1)训练阶段不需要循环训练,输入数据直接输入序列数据进行embedding,不需要像RNN一样将序列数据依次放进模型。训练时由input生成attetion(相当于生成中间语言义信息,key-value),由output根据input生成的中间语义及目标值序列加掩码输出预测结果。2) 解码阶段需要循环解码,由语义及已经解码部分持续 生成未解码部分。2. embedding1) embedding由输入数据embedding、位置信息embed.
2020-11-17 16:11:33 285 1
原创 无推导GBDT
1.GBDT整体上的效果相当于将数据集划分成了很多小的子空间,用子空间的均值作为空间内样本的估计值。2.学习方法是提升方法,先用一个弱学习器作为基本预测y0=f(x),此时预测值y0和真实值Y之间会有误差,然后将这个误差通过一个损失函数进行扭曲和放大;损失函数自变量是y0,因变量是L,思路是希望调整y0使L变小。3.使L变小最快的方法将y0沿损失函数负梯度方向调整,也即梯度下降。实现上是将...
2020-04-04 11:17:26 184
原创 kaldi之HCLG生成
1.words.txt : word->id ; phones.txt: 音素->id; silence.csl:静音音素id; disambig.int:消歧音素id
2020-04-01 14:55:09 933
原创 GMM-HMM语音识别
模式识别中,一般假设噪声服从高斯分布,0/1信号加上噪声后,接收端会将信号放在两个高斯中算概率,然后用判决门限来识别原始信号,是单高斯模型。音素识别时,也可以用K个高斯表示K个音素混合,类似聚类的思路。但语音识别中是用多个高斯来表示一个音素,因为分帧时会将音素分成很多段,每帧不一定包含了一个完整的音素。语音识别中可以用KMeans来找HMM的参数初始值。...
2020-02-21 07:17:24 302
原创 语音识别之特征提取
1.因为语音信号不是平稳信号(均值方差等统计特征随时间变化),所以需要将信号分切成很多短的小范围内平稳的信号段(到音素级别),也就是分帧,常用的帧长为 25ms,帧移是10ms,前后帧重叠会使前后帧的统计特征不至于变化太大。分帧是用窗口函数与原信号相乘,但时域相乘到了频域是卷积,窗口函数如果用矩形窗则会因为矩形信号频谱有比较大的旁瓣而造成频率泄漏,所以一般用旁瓣小的汉明窗。采样时频率分辨...
2020-01-12 12:38:30 1495
原创 单纯形法二
1)检验数,目标函数其实可写成:基系数*基值+检验数*非基值(原来的目标函数是:系数*变量值,当选基后,矩阵进行了变换,在基不变的性况下变换不影响矩阵的解,即可将解算出来,放到原目标函数中)。如果检验数大于0,说明非基变量如不为0,目标函数可继续增大。反之如所有检验数都小于0,则相应的系数都应取0,否则目标函数会变小。这里检验数实际代表了变量对目标函数之单位增量(当然是在确定基条件下)。2)换
2013-07-28 21:37:22 1833 1
原创 Eclipse加载Nutch2.1
主要参考文献[1]http://wiki.apache.org/nutch/RunNutchInEclipse 步骤说明:1) 下载安装Java,设置Java环境变量。2) 下载并安装Eclipse(选择javaee developers版本即可),选help/Eclipse Marketplace菜单,安装Subeclipse、IvyDE、m2e插件。3)
2013-01-06 18:48:03 1161
hadoop报告
2013-07-23
hadoop指南2 Hadoop The Definitive Guide 2nd Edition
2011-03-21
Hbase操作示例 Hbase的读写例子
2011-03-21
计算器源文件(MFC)
2008-11-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人