机器学习速成
南孚先生
这个作者很懒,什么都没留下…
展开
-
机器学习学习记录【持续更新】——神经网络
神经网络非线性问题神经网络的构建过程简单的线性结构隐藏层激活函数总结非线性问题如果还记得特征组合这一单元的话,你就会发现以下分类问题属于非线性问题:“非线性”意味着您无法使用形式为线性的模型准确预测标签。也就是说,“决策面”不是直线。之前,我们了解了对非线性问题进行建模的一种可行方法 - 特征组合。现在,请考虑以下数据集:上图所示的数据集问题无法用线性模型解决。神经网络的构建过程简...原创 2020-02-16 16:21:34 · 145 阅读 · 0 评论 -
机器学习学习记录【持续更新】——分类
分类阙值真与假以及正类别与负类别准确率、精确率和召回率准确率精确率召回率精确率和召回率的关系ROC曲线和AUCROCAUC阙值如果某个逻辑回归模型对某封电子邮件进行预测时返回的概率为 0.9995,则表示该模型预测这封邮件非常可能是垃圾邮件。相反,在同一个逻辑回归模型中预测分数为 0.0003 的另一封电子邮件很可能不是垃圾邮件。可如果某封电子邮件的预测分数为 0.6 呢?为了将逻辑回归值映...原创 2020-02-15 16:42:18 · 189 阅读 · 0 评论 -
机器学习学习记录【持续更新】——L2正则化
L2正则化什么是L2正则化?lambda什么是L2正则化?请查看以下泛化曲线,该曲线显示的是训练集和验证集相对于训练迭代次数的损失。上图显示的是某个模型的训练损失逐渐减少,但验证损失最终增加。换言之,该泛化曲线显示该模型与训练集中的数据过拟合。根据奥卡姆剃刀定律,或许我们可以通过降低复杂模型的复杂度来防止过拟合,这种原则称为正则化。也就是说,并非只是以最小化损失(经验风险最小化)为目标,...原创 2020-02-14 16:24:12 · 306 阅读 · 0 评论 -
机器学习学习记录【持续更新】——特征组合
特征组合为什么要引入特征组合这个概念?特征组合为什么要引入特征组合这个概念?在之前的机器学习过程中,基本上都是在研究一些线性模型,如下图,用一条直线将不同颜色的点分割开来但是,当你遇到下面这样的图形,请问你还可以用一条直线将不同颜色的点分割开来吗?显然是不行的!!!!难道这说明我们之前费劲时间学习的线性模型其实没有什么广泛的用途吗?NO!!!!!线性模型是目前用的最多、计算速度最快的...原创 2020-02-14 15:49:37 · 228 阅读 · 0 评论 -
机器学习学习记录【持续更新】——特征工程
特征工程什么是特征工程?特征工程中的映射映射数值映射分类值良好特征的特点清理数据缩放特征值处理极端离群值分箱清查什么是特征工程?图 1 左侧表示来自输入数据源的原始数据,右侧表示特征矢量,也就是组成数据集中样本的浮点值集。 特征工程指的是将原始数据转换为特征矢量。进行特征工程预计需要大量时间。许多机器学习模型都必须将特征表示为实数向量,因为特征值必须与模型权重相乘。特征工程中的映射映射...原创 2020-02-13 16:24:52 · 198 阅读 · 0 评论 -
机器学习学习记录【持续更新】——训练集、测试集和验证集
训练集、测试集和验证集为什么除了训练集和测试集还需要加验证集?利用这三个集合来重新定义模型的训练流程为什么除了训练集和测试集还需要加验证集?我们介绍了使用测试集和训练集来推动模型开发迭代的流程。在每次迭代时,我们都会对训练数据进行训练并评估测试数据,并以基于测试数据的评估结果为指导来选择和更改各种模型超参数,例如学习速率和特征。**但是多次重复执行该流程可能导致我们不知不觉地拟合我们的特定测试...原创 2020-02-12 16:08:50 · 428 阅读 · 0 评论 -
机器学习学习记录【持续更新】——TensorfFlow线性回归
TensorfFlow线性回归利用TensorFlow构造一个线性模型的步骤导入必要的库加载数据集并且检查数据构建模型第 1 步:定义特征并配置特征列第 2 步:定义目标第 3 步:配置 LinearRegressor第 4 步:定义输入函数第 5 步:训练模型第 6 步:评估模型调整模型超参数利用TensorFlow构造一个线性模型的步骤导入必要的库from __future__ impo...原创 2020-02-12 14:59:55 · 212 阅读 · 0 评论 -
机器学习学习记录【持续更新】——pandas
pandaspandas的简单介绍pandas的主要数据结构DataFrameSeriesPandas访问数据的方法Pandas操控数据的方法pandas的简单介绍pandas 是一种列存数据分析 API。它是用于处理和分析输入数据的强大工具,很多机器学习框架都支持将 pandas 数据结构作为输入。pandas的主要数据结构DataFrame可以将它想象成一个关系型数据表格,其中包含多...原创 2020-02-10 15:24:29 · 212 阅读 · 0 评论 -
机器学习学习记录【持续更新】——降低损失
降低损失降低损失的方法-迭代降低损失的方法-梯度下降法降低损失的方法-随机梯度下降法降低损失的方法-迭代下图是机器学习过程中常见的迭代流程图该图体现了机器学习过程中,通过迭代来减少损失的基本思路。大致思路如下:首先根据数据集中的训练集来得到一个预测模型,然后利用该模型来计算一个特征对应的输出,并且计算出损失。通过获得的损失,来更新预测模型的参数,再反复进行上述过程。直至最后计算出来的损失降...原创 2020-02-02 15:50:17 · 204 阅读 · 0 评论 -
机器学习学习记录【持续更新】—— 框架处理
框架处理主要机器学习术语监督式机器学习标签特征样本模型回归与分类主要机器学习术语监督式机器学习机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。标签标签是我们要预测的事物,即简单线性回归中的 y 变量。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。特征特征是输入变量,即简单线性回归中的 x 变量。简单的机器学习项目可能会使用单个特征,而...原创 2020-01-09 00:02:16 · 107 阅读 · 0 评论