![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 92
数据挖掘
小夏refresh
深度学习炼丹师一枚
展开
-
机器学习知识总结——过拟合和欠拟合
过拟合(overfitting)什么是过拟合?所谓过拟合就是指在验证集和训练集上表现很好,但是在测试集上表现很差,也就是说泛化能力差。一般表现为: 高方差,低偏差过拟合的原因训练样本选取有误、样本标签错误等样本噪声干扰过大模型过于复杂对于神经网络来说:学习迭代次数太多如何防止/解决过拟合问题?扩大数据集进行正则化(L1正则或者L2正则等)采用合适的模型(控制模型的复杂度)Early stopping(通过迭代次数截断的方法来防止过拟合)Dropout(在神经网络中可以原创 2021-01-26 09:09:27 · 1472 阅读 · 1 评论 -
逻辑回归(Logistic Regression)详解
文章目录什么是逻辑回归?逻辑回归的原理最常用的训练模型方法——梯度下降法逻辑回归的损失函数总结什么是逻辑回归?首先,什么是逻辑回归呢?当你看到这个名字的时候,你可能会被他误导,认为他是做回归的,实际上,他是一个分类模型。只不过他是在线性回归的基础上进行了扩展,使其可以进行分类了而已。同样的,逻辑回归的与线性回归一样,也是以线性函数为基础的;而与线性回归不同的是,逻辑回归在线性函数的基础上添加了一个非线性函数,如sigmoid函数,使其可以进行分类。逻辑回归的原理关于逻辑回归的原理呢,大家可以参照原创 2020-11-22 23:57:56 · 1048 阅读 · 1 评论 -
通俗理解线性回归(Linear Regression)
线性回归, 最简单的机器学习算法, 当你看完这篇文章, 你就会发现, 线性回归是多么的简单.首先, 什么是线性回归. 简单的说, 就是在坐标系中有很多点, 线性回归的目的就是找到一条线使得这些点都在这条直线上或者直线的周围, 这就是线性回归(Linear Regression).是不是有画面感了? 那么我们上图片:那么接下来, 就让我们来看看具体的线性回归吧首先, 我们以二维数据为例:我们有一组数据xxx和yyy, 其中xxx是我们的特征, yyy就是我们的真实值(也就是每一个x对应的值), 我原创 2020-09-11 22:53:32 · 4744 阅读 · 1 评论 -
数据预处理和特征工程
文章目录数据挖掘的五大流程数据预处理(preprocessing)数据归一化数据标准化缺失值处理处理离散型特征和非数值型标签处理连续型特征二值化分箱特征选择(feature selection)特征提取(feature extraction)Filter过滤法方差过滤相关性过滤卡方过滤F检验互信息法Embedded嵌入法Wrapper包装法数据挖掘的五大流程获取数据数据预处理数据预处理是从数据中检测,纠正或删除孙华,不准确或不适用于模型的记录的过程目的: 让数据适应模型, 匹配模型的需求原创 2020-07-24 14:28:48 · 413 阅读 · 1 评论