自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

yishujixiaoxiao的博客

原创用python读写文本遇到的UnicodeEncodeError问题

用python读写文本遇到的问题用python读写文本遇到的UnicodeEncodeError问题新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入用python读写文本遇到的UnicodeEncodeError问题跑p

2021-10-11 17:30:09 246

原创编辑距离与语音识别中WER的计算

编辑距离（edit distance）做语音识别算法工程师好几年，最近才弄清楚wer的统计算法-编辑距离，真是惭愧。编辑距离，又称Levenshtein Distance，是一位俄罗斯的科学家Vladimir Levenshtein 在1965年在1965年提出来的。编辑距离指的是在两个字符串S1和S2 之间，将S1转换为S2所需要的最少编辑操作次数。字符编辑操作有且仅有三种：插入（Insertion）删除（Deletion）替换（Substitution）算法公式：我们将两个

2021-03-04 19:54:55 1682 4

转载 Adam那么棒，为什么还对SGD念念不忘

机器学习界有一群炼丹师，他们每天的日常是：拿来药材（数据），架起八卦炉（模型），点着六味真火（优化算法），就摇着蒲扇等着丹药出炉了。不过，当过厨子的都知道，同样的食材，同样的菜谱，但火候不一样了，这出来的口味可是千差万别。火小了夹生，火大了易糊，火不匀则半生半糊。机器学习也是一样，模型优化算法的选择直接关系到最终模型的性能。有时候效果不好，未必是特征的问题或者模型设计的问题，很可能就是...

2020-01-16 16:03:52 404

原创 highway network

highway network 2015年的文章了，由于最近收到了推送，才去详细了解了一下，特意在此做个笔记。highway network的思想很简单，作者受LSTM的启发，在普通的网络上加了两个门而已(一个叫 Transform gate，另一个叫Carry gate)。Highway network可以有效缓解层数特别深的网络在优化时出现的梯度消失问题，可以对1000多层的网络进行有效的...

2019-12-24 14:41:34 302

原创用MS Excel来解释反卷积（Transposed Convolutions）

最近在用Encoder-Decoder hourglass模型做项目，借鉴super resolution 的常用套路，decoder部分是用多层transposed convolutions堆叠而成。刚好Medium给推送了一篇blog，名为《Transposed Convolutions explained with… MS Excel!》，感觉还挺有意思的，特意来做个笔记。这篇博客主要是...

2019-12-20 14:36:05 693 2

转载霍夫曼（huffman）树和霍夫曼编码

参考from:https://www.cnblogs.com/kubixuesheng/p/4397798.html神经网络压缩han song的论文里面提到了霍夫曼编码，以前也对其进行了解过，但是太久没遇到过这个概念，霍夫曼编码的原理也都给忘记了，这次看到了这篇文章，写的很好，所以转载过来方便学习和查找。哈夫曼树也叫最优二叉树（哈夫曼树）问题：什么是哈夫曼树？例：将学...

2019-06-26 09:27:25 1024

原创使用 tensorflow lite 进行CNN模型量化过程中遇到的问题

首先，吐槽下tensorflow lite（1.13）的量化工具太不友好了，不仅相关论文写的晦涩难懂，而且实际操作过程中莫名其妙的问题层出不穷。为了解决这些bug，博主可谓费尽脑汁，终于在头发掉完之前将模型量化成功。言归正传。1. 我使用tensorflow lite的目的是将CNN模型从float32量化压缩成uint8的，理论上模型的大小能减少到原来的1/4。为了简单起见，我使用...

2019-06-06 14:42:04 4420 10

原创 transformer理解

原论文：https://jalammar.github.io/illustrated-transformer/中文翻译：https://blog.csdn.net/qq_41664845/article/details/84969266

2019-03-07 18:22:01 363

转载 viterbi算法和beam search算法的直观解释

Fromhttps://zhuanlan.zhihu.com/p/42006406Viterbi Algorithm(维特比算法)如果target sequence词汇表的大小为的话，对于解码器的步输出，他的搜索空间。随着的增大，那这个效率会非常低。所以我们才想要通过一些算法去找出使得概率最大的输出序列。如果我们把看成是三个状态：HMM那可以看成是HMM，...

2019-01-25 14:15:52 2179

转载语音识别之MFCC特征

From:https://www.cnblogs.com/BaroC/p/4283380.html看了很多提取MFCC特征的博客，这篇讲的最详细，将MFCC的来龙去脉全部讲解清楚了，转来做参考。在任意一个Automatic speech recognition 系统中，第一步就是提取特征。换句话说，我们需要把音频信号中具有辨识性的成分提取出来，然后把其他的乱七八糟的信息扔掉，例如背景噪声啊...

2018-08-10 14:00:49 9975 4

转载语音识别之CTC

关于CTC的详细介绍：https://distill.pub/2017/ctc/这种技术博客，还是老外写的详细。

2018-06-08 09:42:46 1339 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除