机器学习:监督学习、半监督学习、无监督学习、强化学习
训练一个监督学习包括:目标函数、损失函数、模型、优化
模型包括:决策树、线性模型、核模型、神经网络
几种神经网络架构(多层感知机、卷积神经网络、循环神经网络、transformer),抽取庞大的数据特征
1、多层感知机(位于隐藏层):
单层感知机(线性模型)
包括参数矩阵和偏置的全连接层(线性层)y=Wx+b
(Dense layer)全连接层:每一个输入和权重的加权和(数据量庞大)
多层感知机(非线性模型)
引入sigmoid 和 ReLU函数
超参数:隐藏层个数、输出个数
2、卷积神经网络
定义一个k*k的窗口:通过和k*k的权重矩阵做加权和,学习好之后,在和另外一个k*k的窗口共用同一个权重矩阵(参数共享)
数据和数据量无关而是和定义的窗口相关
3、循环神经网络
xt为输入,yt为输出,ht-1为上一时刻的输出,
ht为ht-1和xt的输入进来之后RNN的输出
双向RNN和Deep RNN