机器学习笔记
田田天天甜甜
这个作者很懒,什么都没留下…
展开
-
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第一篇----综述
一、机器学习基础(使用工具sklearn) 机器学习定义,主要的一些概念,主要挑战 一个完整的机器学习项目包含哪些内容## 标题 数据+模型 缺一不可 数据方面: 数据预处理,特征选择,数据可视化 模型方面: 选择算法适配数据,评估模型,(交叉验证,过拟合/欠拟合,学习/验证曲线,各种精度指标),模型参数选择 一些补充概念 核外学习概念:处理计算机内无法应对大量数据,将数据分为小批量,然后使用...原创 2019-06-15 08:41:35 · 320 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第二篇----端到端的机器学习
回归模型例子 一、架构问题,关注蓝图 确定机器学习的类型,监督还是无监督,分类还是回归,批量学习还是在线学习。 选择误差衡量指标,回归模型常见的是均方根误差(RMSE) RMSE与MAE区别 当有很多离群区域时, 你可以考虑使用平均绝对误差(也称为平均绝对偏差) RMSE对应L2范数,MAE对应L1范数 范数指数越高,则越关注大的价值,忽视小的价值。RMSE比MAE对异常值更敏感。但是当异常...原创 2019-06-16 21:10:09 · 977 阅读 · 1 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第三篇----分类模型
从tensorflow下载mnist数据 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets(’/content’,one_hot=True) 解压mnist数据原创 2019-06-17 21:09:27 · 850 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第四篇----训练模型和评估模型
一、训练模型方法 我们介绍两种非常不同的训练模型的方法, 通过“闭式”方程——直接计算出最适合训练集的模型参数(也 就是使训练集上的成本函数最小化的模型参数)。 使用迭代优化的方法,即梯度下降(GD),逐渐调整模型参数直至训练集上的成本函数调至最低,最终趋同于第一种方法计算出来的模型参数。 我们还会研究几个梯度下降的变体,包括批量梯度下降、小批量梯度下降以及随机梯度下降。 二、梯度下降 梯度下...原创 2019-06-21 08:49:18 · 1398 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第五篇----正则线性模型
对线性模型来说,正则化通常通过约束模型的权重来实现。接下来我们将会使用岭回归(Ridge Regression)、套索回归(LassoRegression)及弹性网络(Elastic Net)这三种不同的实现方法对权重进行约束。 一、岭回归(Ridge Regression) 岭回归(也叫作吉洪诺夫正则化)是线性回归的正则化版:在成本函数中添加一个等于 的正则项。这使得学习中的算法不仅需要拟合数据...原创 2019-06-23 15:52:34 · 137 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第六篇----机器学习中的降维方法
文章目录降维的意义数据降维方法投影流形学习数据降维主要技术PCA增量PCAKernal PCALLE 降维的意义 许多机器学习问题涉及训练实例的几千甚至上百万个特征,这不仅导致训练非常缓慢, 也让我们更加难以找到好的解决方案。 这个问题通常被称为维度的诅咒,所以有效的减少特征的数量会提高效率,加快训练。降维对于数据可视化也是非常有用的。 将维度降到两个(或三个) , 就可以在图形上绘制出高维训练集...原创 2019-07-03 09:03:32 · 335 阅读 · 0 评论