![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 78
shuiziliu1025
这个作者很懒,什么都没留下…
展开
-
LIBSVM使用方法及参数设置(转)
原文地址:http://hi.baidu.com/yuanding232323/item/dee80e1a495c0b2bf6625c88 LIBSVM 数据格式需要---------------------- 决策属性 条件属性a 条件属性b ... 2 1:7 2:5 ... 1 1:4 2:2 ... 数据格式转换---------------------- 当数据较少时,可以用for原创 2015-08-18 10:15:25 · 819 阅读 · 0 评论 -
机器学习中的范数规则化之(一)L0、L1与L2范数
转载自:http://blog.csdn.net/zouxy09/article/details/24971995/#comments 机器学习中的范数规则化之(一)L0、L1与L2范数zouxy09@qq.comhttp://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊转载 2016-08-02 14:40:21 · 292 阅读 · 0 评论 -
Precision和Recall
原文出自:http://blog.csdn.net/wangran51/article/details/7579100 最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念偶尔会遇到, 知道意思,但是有时候要很清晰地向同学介绍则有点转不过弯来。 召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。 召回率:Recall,又称“查全率”转载 2016-03-11 21:55:42 · 410 阅读 · 0 评论 -
基于用户的协同过滤算法
最近正在读项亮博士的《推荐系统实践》人民邮电出版社,这本书应当是目前国内为数不多的介绍推荐算法的了。目前正在学习基于用户的协同过滤算法(UserCF : user-based collaborative filtering)。 该算法是推荐系统中最古老的算法,标志着推荐系统的诞生,该算法在1992年提出用于邮件过滤系统,1994年被GroupLens用于新闻过滤。 算法的主要思想是如果一个原创 2015-08-18 10:15:06 · 1144 阅读 · 0 评论 -
基于物品的协同过滤算法
之前的一篇博文里介绍的是基于用户的协同过滤算法http://blog.sina.com.cn/s/blog_dac9ee630102vhmh.html 但是该算法随着用户数目增多的情况下计算用户兴趣相似性矩阵将越来越困难,其运算复杂度空间复杂度的增长和用户的增长接近于平方的关系。所以就出现了基于物品的协同过滤算法(ItemCF: item-based collaborative filteing)原创 2015-08-18 10:15:11 · 1068 阅读 · 0 评论 -
浅谈支持向量机
支持向量机(SVM)是一种两类分类模型,基本模型是定义在特征空间上的间隔最大的线性分类器。它还包括核技巧,这使它成为实质上的非线性分类器。SVM的学习策略就是间隔最大化。假设给定一个特征空间上的训练数据集 T={(x1,y1),(x2,y2),......(xN,yN)}, N 为特征数目,yi为标记。 (xi,yi)为样本点。学习的目标是在特征空间中找到一个超平面,能够将实例分到不同的类。 一、原创 2015-08-18 10:15:21 · 539 阅读 · 0 评论 -
AdaBoost算法
1. AdaBoost原理 AdaBoost,是英文"Adaptive Boosting"(自适应增强)的缩写,由Yoav Freund和Robert Schapire在1995年提出。它的自适应在于:前一个基本分类器分错的样本会得到加强,加权后的全体样本再次被用来训练下一个基本分类器。同时,在每一轮中加入一个新的弱分类器,直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数。原创 2015-08-18 10:15:39 · 596 阅读 · 0 评论 -
k近邻
k近邻法(k nearest neighbor algorithm,k-NN)是机器学习中最基本的分类算法,在训练数据集中找到k个最近邻的实例,类别由这k个近邻中占最多的实例的类别来决定,当k=1时,即类别为最近邻的实例的类别。 如上图所示(引自wiki),当k=3时,此时红色的个数为2,则绿色的输入实例的类别原创 2015-08-18 10:15:33 · 569 阅读 · 0 评论 -
决策树
机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 从数据产生决策树的机器学习技术叫做决策树学习, 通俗点说就是决策树,说白了,这是一种依托于分类、训练上的预测树,原创 2015-08-18 10:15:31 · 511 阅读 · 0 评论 -
机器学习中的范数规则化之(二)核范数与规则项参数选择
机器学习中的范数规则化之(二)核范数与规则项参数选择zouxy09@qq.comhttp://blog.csdn.net/zouxy09上一篇博文,我们聊到了L0,L1和L2范数,这篇我们絮叨絮叨下核范数和规则项参数选择。知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正。谢谢。三、核范数核范数||W||*是指矩阵奇异值的和,英文称呼叫Nuclear Norm。这个相对于上面火热转载 2016-08-02 15:12:03 · 474 阅读 · 0 评论