分类
会飞的猩猩。
这个作者很懒,什么都没留下…
展开
-
KS曲线和ROC曲线(一)
KS曲线和ROC曲线都是在对二分类模型做评估时的一种直观表现。以前用的和听得多的是ROC曲线,很少会听到KS曲线。只能说偶孤陋寡闻了。下面就聊一聊KS曲线和ROC曲线。 既然要画曲线,我们先看看需要用到哪些数据。因为是二分类,我们就分为正样本和负样本。 TP 真正例,也就是被正确分类的正样本 FP 假正例,也就是被误分为正样本的负样本 TN 真反例,也...原创 2018-12-17 23:15:20 · 4706 阅读 · 0 评论 -
朴素贝叶斯算法
朴素贝叶斯算法是一种生成算法,主要用于分类,可以处理非线性的数据。它会计算样本属于每一个类的后验概率,然后判定样本属于后验概率最大的那一个类。朴素贝叶斯有两个假设条件: 条件独立假设:用于分类的特征在类确定的条件下都是条件独立的; 连续型特征服从正太分布假设:如果特征是连续型的变量,就假设该特征服从正太分布。 这些假设使朴素贝叶斯算法变得简单(这个我们可以在后面看到),但有时也会牺牲一定的分类...原创 2018-12-26 20:55:59 · 1352 阅读 · 0 评论 -
softmax回归
之前讲了一下逻辑回归,主要是用于二分类的。对于多分类的问题,我们可以用softmax回归。逻辑回归使用的是sigmoid函数,将wx+b的值映射到(0, 1)的区间,输出的结果为样本标签等于1的概率值;而softmax回归采用的是softmax函数,将wx+b的值映射到[0, 1]的区间,输出的结果为一个向量,向量里的值为样本属于每个标签的概率值. 我们先来看一下softmax函数,它将非标准化...原创 2019-01-02 21:58:23 · 8904 阅读 · 0 评论