第一章 机器学习基本概念介绍
问题:要预测YouTube频道第二天的订阅/播放
1、预测一个有未知参数的函数
2、定义LOSS
- LOSS也是函数,它的参数是(b,w)
- LOSS返回两个参数是好还是不好
- 如何计算LOSS(通过频道的历史来检测)
- 比对 y ^ \hat{y} y^和y
- 真实的值叫做label
- 可以选择absolute error(绝对值的差值)或者square error(差值的平方)的平均值
3、Optimization(优化)
Gradient Descent(梯度下降)
- hyperparameters:自定义的参数
- 梯度下降算法就是不挺的求导并且算出下一个w值,直到处的导数为0或者求值次数达到上线
- 这类模型有一种共同的名称叫做线性模型
4、线性模型是否太简单了?
- 线性模型有很多限制——model Bias
- 我们需要更加flexible的function
- sigmod function拟合分段线性函数函数
-
简化成矩阵和向量的形式
-
batch和epoch
batch大小B也是hyperparameters
- relu模型
- 神经元
-
深度学习:多层的RELU叠加
-
overfitting:过度训练
Colab的使用
[Colab Tutorial 2022 (ntu.edu.tw)](https://speech.ee.ntu.edu.tw/~hylee/ml/ml2022-course-data/Colab Tutorial 2022.pdf)
Google Colab 快速上手 - 知乎 (zhihu.com)
分配到GPU后就可以调用pytorch了
然后可以创建一个Google云盘
连接到云盘里的文件夹
%cd /content/drive/MyDrive
#change directory to google drive
!mkdir ML2022 #make a directory named ML2022
%cd ./ML2022
#change directory to ML2022