现在人工智能、大数据行业决定定位的核心因素是:企业本身掌握的数据量级,即
掌握的的相关数据量越大,算法作出的模型更加可靠。
判别分析
(discriminatry analysis ) 的任务是根据已掌握的一批分类明确的样本,建
立较好的判别函数,使产生错判的事例最少,进而对给定的一个新样品,判
断它来自哪个总体;
贝叶斯(BAYES)
每个人脑中都有一个贝叶斯
判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。
所谓先验概率,就是用概率来描述人们对所研究的对象的认识的程度;
注:
所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概
率,它是对先验概率修正后的结果。
8点10分起床迟到的概率是 –条件概率
费歇判别
思想(FISHER)是 投影(再做分类),使多维问题简化为一维问题来处理,选
择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。 对这
个投影轴的方向的要求是: 使每一类内的投影值所形成的类内离差尽可能小,而
不同类间的投影值所形成的类间差离尽可能大。 实际应用不多!!
朴素贝叶斯应用场景:
最基础: 朴素贝叶斯
常用于:
识别垃圾邮件;