数据挖掘
文章平均质量分 90
aa_JamesJones
这个作者很懒,什么都没留下…
展开
-
机器学习(数据挖掘)总结
一.“没有免费的午餐”(no free lunch,NFL)定理简单易懂的解释:1、一种算法(算法A)在特定数据集上的表现优于另一种算法(算法B)的同时,一定伴随着算法A在另外某一个特定的数据集上有着不如算法B的表现;2、具体问题(机器学习领域内问题)具体分析(具体的机器学习算法选择)。二.模型评估方法:1、留出法:将数据集划分为互斥的训练集和测试集。训练/测试集的划分要尽可能保持...原创 2018-09-26 16:50:40 · 2992 阅读 · 0 评论 -
L0、L1、L2范数及正则化
范数对于一个向量来说是一个向量的长度(模),对于一个矩阵来说是矩阵中所有向量的长度的求和。在深度学习中,监督类学习问题其实就是在规则化参数同时最小化误差。最小化误差目的是让模型拟合训练数据,而规则化参数的目的是防止模型过分拟合训练数据。参数太多,会导致模型复杂度上升,容易过拟合,也就是训练误差小,测试误差大。因此,我们需要保证模型足够简单,并在此基础上训练误差小,这样训练得到的参数才能保证...原创 2018-10-02 21:55:29 · 855 阅读 · 0 评论 -
机器学习算法 -- SVM 详解
一、简介支持向量机(support vector machines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。由简至繁的模型包括:当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机 当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机 当训练样本线性不可分时,通过核技巧和软间隔最...原创 2019-01-12 17:12:04 · 1044 阅读 · 0 评论