sjyttkl的专栏

机器学习基本算法

排序:
默认
按更新时间
按访问量

LCS算法

个人分类: DP之 LCS 刚刚开始看这个算法,真的不是很懂,不过看了一个牛牛的博客,http://blog.csdn.net/v_july_v/article/details/6695482,觉得写得挺好,可以看看。  程序员编程艺术第十一章:最长公共子序列(LCS)问题 0、前...

2018-09-13 22:28:26

阅读数:43

评论数:0

字符串相似度算法(编辑距离算法 Levenshtein Distance)

在搞验证码识别的时候需要比较字符代码的相似度用到“编辑距离算法”,关于原理和C#实现做个记录。 据百度百科介绍: 编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑...

2018-09-13 22:25:18

阅读数:66

评论数:0

混淆矩阵(Confusion Matrix)

混淆矩阵是除了ROC曲线和AUC之外的另一个判断分类好坏程度的方法。以下有几个概念需要先说明:TP(True Positive): 真实为0,预测也为0FN(False Negative): 真实为0,预测为1FP(False Positive): 真实为1,预测为0TN(True Negativ...

2018-05-31 21:30:16

阅读数:80

评论数:0

Word Embedding与Word2Vec

一、数学上的“嵌入”(Embedding)Embed这个词,英文的释义为, fix (an object) firmly and deeply in a surrounding mass, 也就是“嵌入”之意。例如:One of the bullets passed through Andrea'...

2018-05-15 16:21:35

阅读数:113

评论数:0

神经网络训练中,Epoch、Batch Size和迭代傻傻分不清?

你肯定经历过这样的时刻,看着电脑屏幕抓着头,困惑着:「为什么我会在代码中使用这三个术语,它们有什么区别吗?」因为它们看起来实在太相似了。为了理解这些术语有什么不同,你需要了解一些关于机器学习的术语,比如梯度下降,以帮助你理解。这里简单总结梯度下降的含义...梯度下降这是一个在机器学习中用于寻找较佳...

2018-05-13 16:03:31

阅读数:46

评论数:0

归一化、标准化和正则化的关系

归一化(Normalization)        1.把数据变为(0,1)之间的小数。主要是为了方便数据处理,因为将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。        2.把有量纲表达式变换为无量纲表达式,成为纯量。经过归一化处理的数据,处于同一数量级,可以消除指标之间的量纲...

2018-05-11 17:17:00

阅读数:34

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭