1.机器学习步骤:
①选择模型(模型可以看作一组函数的集合)
②利用损失函数L判断模型中函数f的好坏
③选择最好的模型函数f(本质是选择模型函数中的参数w,b使得L(f)最小)
Q:如何找使得L(f)最小的参数呢?
A:梯度下降算法(gradient descent)
如果L(w)有多个极小值,梯度下降的做法是无法找到最小值的。但是损失函数的选取规定会使其只有一个极小值。也就是说L(w)不会出现下图左边的情况,而只会像一个“锅”一样:
2.模型函数f为什么要求越平滑越好?
输入被其他因素干扰的话,输出受到的影响越小
3.作业 参考文章
①数据预处理:
利用panda将空数据NR补为0;
将清洗过的数据转化为np数组;
利用np定义数据集的输入和输出;
1)x_train数组形状是(3600,18,9),也就是3600个18*9的矩阵,因此x_train[j, 9, :]表示每一个矩阵中第10行的全部元素,也就是10个PM2.5的值作为输入
②模型搭建
③训练集训练,测试集测试