一、机器学习的目标
1.1目标:寻找函数
1.2函数分类
1.Regression:输出是数值
2.Classification:给出选项(classes),选出正确的选项
3.Structured learning:创建有结构的东西(图像、文件)
二、机器学习案例
2.1案例介绍
输入网站后台资料,预测隔天点击阅读人数
2.2训练步骤
2.2.1猜测(带有未知参数)函数
模型:
:预测今天的点阅人数 (特征):已知的前天的点阅人数 (权重),(偏置):未 知参数
2.2.2定义损失函数
定义:评价参数的好坏
损失函数输入:模型中的未知参数
label:真实的数值
使用的是mean absolute error(MAE 平均绝对误差)
使用的是mean square error(MSE 均方误差)
如果和都是几率分布,可能会采用交叉熵损失(cross entropy)
2.2.3最优化(optimization)
假设有一个未知参数,优化方式选择梯度下降(Gradient Descent)
:学习率,是hyperparameters(机器学习中需要自己设定值的参数)
步骤1:随机选取初始点
步骤2:计算,
步骤3:不断更新w
停止标准:到达设定或者微分数变为0
出现的问题:到达(Local minima)就停止,没有找到global minima,但这不是梯度下降真正的错误
二个参数:
预测结果与真实值差距
出现的问题:该模型都是用前一天预测后一天,但真实值有周期性,可以用前一周预测下一周,前一个月预测下一个月
出现的问题:线性模型过于简单,考虑更多天,测试时结果已到极限