机器学习和概率统计的关系
机器学习是一个比较宽泛的概念,主要包括有监督学习,无监督学习,强化学习等,每个分类又有很多不同的算法,在使用时需要根据不同的场景进行选择,这个将会在后续的博客中涉及,这里就不展开叙述。现在的机器学习主要都是基于对现有样本的观测分析(统计)然后再对未知样本的预测(概率),我自己一个不严谨的说法就是机器学习是一种特殊的概率统计表现形式。
概率统计的关注点
概率与统计的水很深,我们不是为了学习概率与统计,而是为了进行 机器学习而补充相关的概率统计知识,关键是打通概率与统计和机器学习的关系。概率统计根据是否已知整体进行区分:统计是已知一个样本的分布,并从中采样若干样本来计算分布的整体情况,如均值和方差等;概率是已知整体的情况,去预测某一种情况发生的概率,统计和概率互为逆工程。
机器学习与概率统计的关系
一个有监督学习算法,先要将带有标签的样本特征输入到算法模型中进行训练,然后将标签未知的样本特征喂给训练好的算法模型得到一个输出预测。对带有标签样本特征进行训练的过程就是我们统计的应用,就像对一个装有若干白球和黑球的桶我们进行多次的抓取采样,并记录我们采样的结果,根据采样的