![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
machine learning
文章平均质量分 60
lotuswhl
http://www.cnblogs.com/dragonboss/
展开
-
白话系列之 bias and variance
机器学习中的bias和variance简单理解bias 和variance的概念理解一点点背景 在常见的机器学习问题中,我们往往希望根据已有的数据,使用机器学习的模型和算法去学习已知数据的信息;我们的最终目标是希望我们可以学习到原始数据的真实分布,真实模型,因为只有这样我们才可以使用学习到模型去做我们想做的事,比如预测,判别等等。既然要学习到数据的真实分布,又不得不提机器学习...原创 2018-03-15 16:13:17 · 285 阅读 · 0 评论 -
how to choose a machine learning classifier
如何选择一个机器学习分类器你是如何为你的分类问题选择机器学习算法的呢?当然,如果你很关注accuracy,那么最佳方案便是测试一组不同的算法(当然,相应的也要确保对每个算法进行不同参数的尝试),然后通过交叉验证选择其中最好的一个算法。但是,如果你只是想找一个“足够好”的算法,或者寻起初步方案,那么这里有一些不错的通用的方案可供借鉴。你的训练数据集有多大?如果你的数据集比较小,那么h...翻译 2018-03-12 19:20:58 · 399 阅读 · 0 评论 -
questions upon machine learning
what is the difference between LR and SVMlogistic regression 似乎在实用一个连续的函数匹配数据并不总是单分类问题,所以LR可能会存在对P=0.5的情况难以分类SVM则试图使用一个超平面去将一组多维数据分割成两类SVM对于非线性可分的数据难以分类,或者如果两类数据之间的间隔不足,也会导致SVM难以分类。How are ...原创 2018-03-12 19:22:35 · 130 阅读 · 0 评论 -
support vector machines
支持向量机支持向量机最简单的理解: 支持向量机可以用于对数据进行分类也可以用于回归。其本质是要在两类数据特征向量之间寻找一个分隔超平面,用于将两类样本分离。其主要特征在于,要寻找的超平面是可以将两类数据特征向量到超平面的距离最远;也就是不仅仅要找到一条超平面用于分隔两类数据,而且还要使得边界距离最大化。在支持向量机中还有两个概念:函数距离:也就是样本点到超平面的距离...原创 2018-03-12 19:23:37 · 1376 阅读 · 0 评论 -
deep residual net introduction
深度残差网络简介背景 随着深度卷积神经网络的广泛引用,其强大的特征提取能力,使得我们可以使用end-to-end的方式进行网络训练,使得卷积网络本身可以学习到需要的特征,解决我们的目标问题:如图像分类。 但是由于我们使用的是基于梯度下降的backpropagation优化方法,随着网络深度的增加,不得不处理随之而来的梯度vanish、exploding等问题,这给深度网络的训练...原创 2018-03-12 23:17:59 · 186 阅读 · 0 评论 -
随笔系列之- log loss
log loss在机器学习构建分类模型的任务中经常使用的损失度量方法; 对数损失的公式为: −∑iN∑jMyijlog(pij)−∑iN∑jMyijlog(pij)-\sum_i^N\sum_j^My_{ij}log(p_{ij}) 其中N对应于我们的样本数或者输入的实例的数量,i对应于某一个样本或者实例;M表示我们的样本可能的分类数量,j表示某一个分类;yijyijy_{ij} 表示对...原创 2018-04-01 21:41:55 · 5358 阅读 · 0 评论 -
随笔系列之- ROC And AUC
关于ROC与AUC的一点点介绍ROC Receiver Operating CharacteristicsROC是一种曲线用于描述二分类判别器对不同的threshold的曲线;用于表达判别器的分类能力; 其主要有两个指标:TPR和FPR,根据这两个值(不同的threshold有不同的值)来绘制曲线;TPR : True Positive Rate TPR=TPTP+FNTPR=...原创 2018-04-02 21:33:20 · 348 阅读 · 0 评论 -
随笔系列之- 数据的类型(Categorical(Nominal),Ordinal,Internal)
几个数据类型:Categorical Type,Ordinal Type,Interval Type介绍在机器学习或者数据处理的任务中,我们遇到的数据类型往往是多种多样的,对于不同的数据类型,我们的处理方式/分析方法会有所不同,因此了解不同的数据类型是有必要的.下面简单的介绍一下这几种数据类型,也便于自己以后参考,不足之处,日后修正.Categorical Type 什么是ca...原创 2018-04-03 00:24:39 · 11013 阅读 · 0 评论 -
随笔系列之 交叉熵(cross entropy) and KL divergence
有关交叉熵Cross Entropy 与KL 散度的一点点cross entropy我相信了解过机器学习的基本算法的人没有不知道交叉熵这个东西的;通常,我们在机器学习的模型训练中会使用交叉熵作为我们损失函数 log loss. 但是,我们可能大概的理解,只要这个交叉熵损失函数越小,我们的模型就会越准确,似乎是意见很神奇的事情;如果理解的多一点的可能会从其表达式来理解,比如:二分类问题的交叉...原创 2018-05-03 22:26:26 · 1549 阅读 · 0 评论