NLP2.2:梯度下降法的收敛性证明
1、复习凸函数凸函数有全局最优解神经网络是非凸函数,有大量的局部最优解,需要好的初始化(pre-training)2、如何解决一个非凸函数:Set cover problem2.1 Approach 1: Exhaustive Search——穷举法1、遍历每一个集合:看它们是否有等于U2、一次选择两个集合:共有16种不同的方法,看它们的并集是否满足U3、一次选择三个集合…考虑了所有的可能的组合,可以得到全局最优解2.2 Approach 2: Greedy search:贪
复制链接