L18
心理学与DL,RL
巴浦洛夫的狗:
消退:词向量需要不断更新
泛化:被蛇咬过,看到绳子也害怕。
过拟合
欠拟合
过拟合与欠拟合的区别在于,欠拟合在训练集和测试集上的性能都较差,而过拟合往往能较好地学习训练集数据的性质,而在测试集上的性能较差。
联结主义:
给一个行为:X-黑箱子-Y
多次重复该行为后,X与Y就有了联结
L19
斯金纳的鼠
操作性条件反射
那么反馈机制很重要:
强化学习的目标函数(李宏毅的PPT):
强化原理:正强化,负强化
reward机制:正惩罚,负惩罚
L20
Pipeline:
Word Segme