为什么要假设数据是独立和相同分布?
这个假设让maximization在数学上非常容易计算。观察数学的独立和相同分布(independent and identical distribution)的假设,简化了优化问题中likelihood函数的计算。
另外 我们用来训练的样本点具有较好的总体代表性。为什么要有总体代表性?我们要从已有的数据(经验) 中总结出规律来对未知数据做决策,如果获取训练数据是不具有总体代表性的,就是特例的情况,那规律就会总结得不好或是错误,因为这些规律是由个例推算的,不具有推广的效果。通过独立同分布的假设,就可以大大减小训练样本中个例的情形。
总结来说,就是为了方便计算,并易于分析。非独立的太复杂。