Machine Learning
文章平均质量分 72
wh62592855
这个作者很懒,什么都没留下…
展开
-
信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) =转载 2012-02-11 15:17:17 · 2583 阅读 · 0 评论 -
比较决策树和回归
营销预测模型的目标变量很多为一种状态或类型,如客户“买”还是“不买”、客户选择上网方式为 “宽带”还是“拨号”、营销战通道是邮件、电话、还是网络。我们把这类问题统称为 “分类”。决策树和逻辑回归都是解决“分类”问题的高手。用不同的算法解答同样的问题,自然引出了两者孰优孰劣的讨论,但迄今为止,仍然没有一个明确的结论。出现这种情况是意料之中的,因为两者的具体表现取决于数据状况和挖掘人员的水平。从算法本转载 2012-02-11 18:36:20 · 2310 阅读 · 0 评论 -
决策树算法
1、摘要 在前面两篇文章中,分别介绍和讨论了朴素贝叶斯分类与贝叶斯网络两种分类算法。这两种算法都以贝叶斯定理为基础,可以对分类及决策问题进行概率推断。在这一篇文章中,将讨论另一种被广泛使用的分类算法——决策树(decision tree)。相比贝叶斯算法,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。2、转载 2012-02-11 16:24:40 · 1217 阅读 · 0 评论 -
overfitting(过度拟合)的概念
本文转自:http://blog.csdn.net/fengzhe0411/article/details/7165549最近几天在看模式识别方面的资料,多次遇到“overfitting”这个概念,最终觉得以下解释比较容易接受,就拿出来分享下。overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合转载 2014-02-13 17:17:59 · 6372 阅读 · 0 评论 -
主成分分析(Principal components analysis)-最大方差解释
本文转自:http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做P转载 2014-02-13 18:58:39 · 6478 阅读 · 1 评论 -
浅谈协方差矩阵
本文转自:http://hi.baidu.com/hehui1500/item/fba9444327a24693823ae1e9今天看论文的时候又看到了协方差矩阵这个破东西,以前看模式分类的时候就特困扰,没想到现在还是搞不清楚,索性开始查协方差矩阵的资料,恶补之后决定马上记录下来,嘿嘿~本文我将用自认为循序渐进的方式谈谈协方差矩阵。统计学的基本概念学过概率统计的孩子都知转载 2014-02-14 11:45:05 · 6021 阅读 · 0 评论 -
Treelink算法介绍
本文转自:http://www.searchtb.com/2010/12/an-introduction-to-treelink.html“机器学习”这个名词对大家来说想必不是一个陌生的词汇,特别对算法组的同学来说,工作中或多或少接触使用过这种“高科技“。对于我来说,刚来淘宝工作一个月就开始接触了机器学习,当时做主搜索功夫熊猫项目,和小致飘雪一起做交易模型,正是使用了机器学习的方法,也首次转载 2014-03-01 15:07:19 · 7007 阅读 · 0 评论 -
AUC与ROC - 衡量分类器的好坏
二元分类器 二元分类器是指要输出(预测)的结果只有两种类别的模型。例如预测阳性/阴性,有病/没病,在银行信用评分模型中,也用来预测用户是否会违约,等等。 既然是一种预测模型,则实际情况一定是有些结果猜对了,有些结果猜错了。因为二元分类器的预测结果有两种类别(以下以阴/阳为例),对应其真实值,则会有以下四种情形:1. 预测为阳性,真实值为阴性 (伪阳性)2. 预测为阴性转载 2014-08-20 12:14:19 · 7494 阅读 · 0 评论 -
聚类算法实践
转自:http://www.itongji.cn/article/0r52d32013.htmlhttp://www.itongji.cn/article/0R52D42013.htmlhttp://www.itongji.cn/article/0R52E22013.html-----所谓聚类,就是将相似的事物聚集在一起,而将不相似的事物划分到不转载 2015-04-02 15:53:28 · 11085 阅读 · 0 评论