==》https://www.zhihu.com/question/54082000
似然表达了给定样本下参数(相对于另外的参数)为真实值的可能性
==》我们再回到这个表达。首先我们严格记号,竖线表示条件概率或者条件分布,分号表示把参数隔开。所以这个式子的严格书写方式是因为在右端只当作参数理解
==》https://www.cnblogs.com/LeftNotEasy/p/mle-cross-entropy-and-deep-learning.html
对于学习任务而言,我们需要学习的是一个给定分类函数的参数θθ, 这个函数可以是任何函数,只要这个函数最终能输出三分类对应的概率向量就可以了。对于θθ而言,我们的目标是,对于给定的输入,输出值越接近真实值越理想,这个就是所谓的最大似然