机器学习
柚子you
这个作者很懒,什么都没留下…
展开
-
线性回归算法
1.简单线性回归在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析;简单线性回归是属于回归(regression),即label为连续数值型,即用一条直线,最大程度的拟合样本特征和样本数据标记之间的关系建模过程,就是找到一个模型,最大程度的拟合我们的数据,最大的拟合数据,本质上就是找到没有拟合的部分,也就是损失的部分尽量小,就是损失函...原创 2020-03-29 21:37:11 · 3318 阅读 · 0 评论 -
数据预处理和特征工程
1.无量纲化:当数据量纲不一致时需要进行归一化处理,有两种方法:最值归一化(normalization): 把所有数据映射到0-1之间。最值归一化的使用范围是特征的分布具有明显边界的(分数0~100分、灰度0~255),受outlier的影响比较大;均值方差归一化(standardization): 把所有数据归一到均值为0方差为1的分布中。适用于数据中没有明显的边界,有可能存在极端数据值的...原创 2020-03-29 20:42:14 · 338 阅读 · 0 评论 -
梯度下降法
一 梯度下降法原理梯度下降(Gradient Descent, GD),是一种基于搜索的最优化方法。梯度下降(Gradient Descent, GD)优化算法,其作用是用来对原始模型的损失函数进行优化,以便寻找到最优的参数,使得损失函数的值最小。机器学习就是需找一种函数f(x)并进行优化, 且这种函数能够做预测、分类、生成等工作。而梯度下降是目前机器学习、深度学习解决最优化问题的算法中,最核...原创 2020-03-29 19:43:16 · 324 阅读 · 0 评论 -
评估机器学习模型的好坏
1.训练集和测试集在用模型进行预测或分类的时候,需要判断得到模型的好坏,就要事先将数据分为训练集合测试集,在sklearn中直接调用train_test_split来划分数据:from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, ...原创 2020-03-08 22:37:56 · 1290 阅读 · 0 评论 -
KNN算法
一.算法思想KNN算法又称为K近邻学习,是一种监督学习学习算法,可用于分类和回归,其原理就是:给定测试样本,基于距离(一般是欧式距离)找出训练集中与其最靠近的的个训练样本,然后基于这K个样本来预测;在分类任务中,可使用投票法即选择这K个样本中出现最多的类别作为预测的分类结果;在回归任务中,选择这K个样本的均值作为回归预测值。二.代码实现from sklearn import datasets...原创 2020-03-01 18:54:09 · 457 阅读 · 0 评论