google 机器学习速成课程笔记1

最新推荐文章于 2020-09-09 20:20:27 发布

wangqi1113

最新推荐文章于 2020-09-09 20:20:27 发布

阅读量262

点赞数

分类专栏： tensorflow 机器学习 python 文章标签：机器学习 tensorflow

本文链接：https://blog.csdn.net/wangqi1113/article/details/80197137

版权

机器学习同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

tensorflow

4 篇文章 0 订阅

订阅专栏

python

3 篇文章 0 订阅

订阅专栏

学习谷歌的机器学习速成课程

标签：标签是我们要预测的事物，也就是y
特征：特征是输入变量，也就是x，按照如下方式指定{x1,x2,x3….,xN}，合适的特征应该是具体可量化的，for example，喜欢不是可观察且可量化的指标，鞋的美观程度也不是，但是鞋码和用户点击鞋子描述的次数是一种具体可量化的指标。
样本：指数据的特定实例，有标签样本和无标签样本
模型：模型定义了特征和标签之间的联系，分为训练和推断阶段
分为回归和分类两大类问题。回归模型可预测连续值，分类问题预测离散值。

回归问题中的误差：
L2正则化 平方误差 cost = $\sum_{D}(y’-y)^2$ D为样本
MSE均方误差 ,每个样本的平均平方损失 cost = $\frac{\sum_{D}(y’-y)^2}{||D||}$

降低损失
梯度下降法
随机梯度下降法 SGD 一次抽取一个样本
小批量梯度下降法 小批量SGD大约10~1000
关于梯度下降，设函数f(x,y),则梯度=[x的偏导数，y的偏导数]。梯度指向函数增长速度最快的方向，负梯度指定函数下降速度最快的方向。梯度是偏导数的矢量，损失相对于单个权重的梯度就导数。
文章中的凸函数是横坐标为w，纵坐标为cost，画出该图需要给定每一个w，计算其对应的cost，这种情况下是一个凸函数，梯度下降的目标就是寻求该函数的最小值，也就是损失函数收敛的地方。
梯度下降法沿着该函数负梯度的方向下降，该方向为函数下降最快的方向，理想情况下，梯度应该是慢慢减小，最后最低点的梯度为0，函数也趋于收敛，后面函数的下降应该是比前面下降的幅度要小，然后慢慢变为0
$w = w - α * d c o s t d w$ $w = w-\alpha*\frac{dcost}{dw}$
$\alpha$ 为一个超参数，代表学习率或者步长，是一个需要调参的值。
模型收敛：总体损失不在变化或者变化缓慢

tensorflow的抽象层次

tensorflow的抽象层次
使用tensorflow.estimator API构建一个线性分类器的例子

import tensorflow as tf
#set up a linear classifier
classifier = tf.estimator.LinearClassifier()

#train the model in train_data
classifier.train(input_fn = train_input_fn,steps = 2000)

#use it to predict
predictions = classifier.predict(input_fn = predict_input_fn)

泛化：防止过拟合，过拟合是由于模型的复杂程度超出所需要的程度造成的
训练集、验证集、测试集
划分训练和测试集合一般采取2-8原则
ps：作业题目中我发现增大批次或者降低学习率都可以降低测试损失和训练损失的差值