机器学习
文章平均质量分 71
存储存储
存储,云
展开
-
精确率 召回率 F1(详细)
精确率召回率等相关知识点经常出现在笔试题中,如果仅考查精确率召回率并不难理解记忆。但是有时结合ROC等知识点时,TP,NP,TN,FN,4个不易区分的符号及各种比率会对初学者的理解产生干扰,本文将几个知识点结合起来举例解释,希望能方便大家理解记忆。背景当我们那一个已知结果的数据对算法进行测试时,不难发现算法对数据判断出现的错误。 当待处理数据简单分为正负两类时,显然 对于原数据来说,只有正负两种原创 2017-02-05 12:56:30 · 1759 阅读 · 0 评论 -
ROC AUC PRC 详细
ROC(receiver operating characteristic curve)受试者工作特征曲线,下图 此图引入了假正率,和真正率。(感觉在读红楼梦) TPR :True Positive Rate(真正率 , TPR)或灵敏度(sensitivity)(就是前文的召回率R) TPR = TP /(TP + FN) 正样本预测结果数 / 正样本实际数 TNR :Tr原创 2017-02-05 13:06:24 · 1856 阅读 · 0 评论 -
分箱问题
问题假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?等宽划分时在第几个箱?分箱问题分为有监督分箱和无监督分箱。无监督分箱等宽分箱 将变量的取值范围分为k个等宽的区间,每个区间当作一个分箱。 在本问题中变量的取值范围为原创 2017-02-05 16:06:08 · 20768 阅读 · 2 评论 -
Octave 入门语法
Octave 是一个简单容易上手的软件,可以用来进行机器学习相关运算,看到相应效果之后再用Python,C,Java,等语言实现。可以最大程度减少开发时间。以下为一些简单的Octave语法。基本操作Q退出 help 帮助 % 用于注释。如 A = [1 2;3 4;5 6]; %新建一个数组A 结尾处加 ; 可以防止数组A打印出来。 A = [1 2;3 4; 5 6]; 下面不出现原创 2017-02-15 13:33:12 · 798 阅读 · 0 评论 -
主成分分析(PCA)
定义PCA的思想是将n维特征映射到k维上(k背景在机器学习过程中,第一步就是数据的处理。在大多数机器学习课程中,为了简化理解,前几节课都是只选取1~2个特征量。如此则引出问题,如果特征量多的话怎么办。在分析回归问题时,引入梯度下降法,该方法对于n个特征均成立。同时也发现,可以用矩阵的方式解出theta的值。不过强调了 **特征矩阵X的转制矩阵(XTX^T)与特征矩阵X的乘积要可逆。(当然利用Octa原创 2017-02-15 20:14:06 · 456 阅读 · 0 评论