简言:机器学习的核心任务是通过数据训练来发现和优化一个映射输入到输出的函数
概念:
根据不同的机器学习任务进行分类:
回归(regression):回归是由输入推出输出
和分类(classification):分类是再几个选项中选出输出项
结构化学习(structured learning):结构化学习是产生有结构的物体,如画
案例分析:
视频点击量预测:
第一步:首先写出推测的带参函数:
参数:y为预测的播放量,x为前一天的播放量,
而未知数:b为偏置(bias)和w为权重(weight),需要用到领域知识(domain knowledge)来猜测,而之后预测出的函数要进行损失测试,与标签(真实值label)做差,并且累计多天的平均绝对误差(Mean absolute error)
第二部:确定学习率,循环尝试
需要自己设定学习率(learning rate)η会影响到步伐(与斜率正相关)
而学习率高则参数量大,学习效果好
第三步:寻最优解
当参数取何值时损失值最小,常用梯度下降(gradient descent),通过斜率的0点的找寻来确定最低点
由此得到了最小损失的参数