机器学习之分类-概率生成模型
分类
定义:按照种类、等级或性质分别归类。
我们要做的就是找到一个模型(函数)可以对数据进行分类最后给出一个对应的预测类别
我们可以可以通过一些数据的导入通过训练确定模型的一些参数,最后推测的类型。
回归与分类
分类问题不适合使用回归的方式来完成,不是说不行,就是最后的模型会惩罚那些太"正确"的结果。
左图是分类任务使用回归方式预测结果,绿色的线是一个比较理想的模型,可以比较好的用回归来预测我们的结果,但是图二这种情况就会导致我们的模型发生偏离变成了紫色的这部分,这效果反而不好了,就是因为他被远远大于1的这部分“他认为是错误的”数据给“带偏了”。
而且实际中两者不一定有这类线性的关系,到最后不一定会有一个好的结果。
Generative Model
两个箱子里面有两种不同的球,球在两个箱子里面的比例不一样,随机从一个箱子里面取一个A球的概率是多少?
首先我们要对数据进行分析,我们最少需要4种数据。
1、球在两个箱子里面的比例(p(c1)/p(c2))
2、两个箱子随机抽取到的比例(p(A|c1)/p(A|c2))
有了这4个值才可以开始构建模型进行计算。
经过计算得到的公式如上图所示。
如果生成一个模型那么模型的公式是什么呢?