机器学习
August-us
似春起之苗,不见其增,日有所长
展开
-
机器学习数据集(训练集、测试集)划分方法
数据集划分方法 &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &epms; &ep原创 2020-06-21 11:52:27 · 31571 阅读 · 0 评论 -
L1和L2正则化(regularization)
L1和L2正则化 理论上来说,只要参数足够多,而且参数之间的关系足够复杂,模型就可以拟合任意的函数。如果连噪声也都拟合了,这就是过拟合。事实上,我们在学习的时候,需要学习的是数据的普遍特征,但是除了普遍特征之外还存在一些少量数据独有的特征,这个特征,我们倾向称之为噪声。 过拟合的具体表现就不细谈了,可以看到根本的原因就是建立的模型过于复杂了,我们想要让这个模型简单点,拟合的函数简单点,这个...原创 2020-04-07 09:54:24 · 23253 阅读 · 6 评论 -
叉熵损失函数(Cross Entropy)
叉熵损失函数(Cross Entropy) 我们在逻辑回归算法中引入了交叉熵函数,但是上一次,我并没有对交叉熵损失函数做一个详细的解释。这里就补上。损失函数又叫做误差函数,用来衡量算法的运行情况.在分类中,都是和分类错误的数量正相关的,分类错误越多,损失也就越大。 我们在逻辑回归中引出,交叉熵,当时说的是如果分错一个类别,就会产生损失。J(θ)=y^lny+(1−y^)ln(1−y)J(θ...原创 2020-03-25 08:25:43 · 25162 阅读 · 0 评论 -
逻辑回归(Logistic Regression)
逻辑回归(Logistic Regression) 逻辑回归(Logistic Regression)大家千万不要被名字所迷惑了,这不是一个回归算法,而是一个二分类问题的分类算法。二分类的目标一般就是对是和不是的区分。 我们很容易想到,可以根据概率统计以及贝叶斯统计的知识。我们假设它是(某个物体),然后计算一个它是的概率,如果这个概率大于它不是(某个物体),我们就判定它是。反之则判定它不是...原创 2020-03-23 14:54:39 · 24970 阅读 · 0 评论 -
混淆矩阵及分类评价指标概念辨析
分类评价指标概念辨析 这些东西其实没什么难的,而且很多人肯定也是很早就接触过了,最大的问题在于时间长了记不住,所以就尽量解释的简单写,用于下次查阅使用。 主要需要理解的就是二分类的指标。 混淆矩阵中,横轴是样本真实标签,决定了样本是正例( P)还是负例(N),纵轴代表模型的估计标签。在辨析各种基本概念的时候,因为这些评价都是和真实标签进行对比。分类分对了就是真(T),分错了就是假(F...原创 2020-03-02 09:34:08 · 24925 阅读 · 1 评论 -
指数滑动平均(Exponential Moving Average)
指数移动平均Exponential Moving Average原创 2020-03-01 11:13:07 · 30077 阅读 · 2 评论