目录
106.强化学习的损失函数(loss function)是什么?
109.强化学习中有value-based 和 policy-based,这两种的优缺点分别是什么?
110.强化学习中的Q-learning算法和Sarsa算法的区别?
101.列出几种文本特征提取算法
文档频率、信息增益、互信息、X^2统计、TF-IDF
102.如何看懂深度学习论文里的数学原理部分?
非常优秀的深度学习研究者,想必既拥有优秀的统计概率思维,又擅长复杂的
目录
106.强化学习的损失函数(loss function)是什么?
109.强化学习中有value-based 和 policy-based,这两种的优缺点分别是什么?
110.强化学习中的Q-learning算法和Sarsa算法的区别?
文档频率、信息增益、互信息、X^2统计、TF-IDF
非常优秀的深度学习研究者,想必既拥有优秀的统计概率思维,又擅长复杂的