data mining + machine learning
me_lawrence
请阅读导航页,那是知识体系的索引。
展开
-
数据挖据十大算法之ID3算法
http://blog.csdn.net/qingdujun/article/details/465821311、引言 ID3算法是用来干什么的?主要用来解决类似于这样的问题:今天天气晴朗、气温适中、湿度高且无风,我应该去打高尔夫球吗? ID3算法是一种贪心算法,用来构造决策树。ID3算法起源于概念学习系统(CLS),以信息熵的下降转载 2015-06-22 09:28:59 · 5379 阅读 · 1 评论 -
数据挖掘(9):BP神经网络算法与实践
http://blog.jobbole.com/90184/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条神经网络曾经很火,有过一段低迷期,现在因为深度学习的原因继续火起来了。神经网络有很多种:前向传输网络、反向传输网络、递归神经网络、卷积神经网络等。本文介绍基本的反向传输神经网络(Backpropagation 简称BP),主要讲述算法转载 2015-09-12 10:33:03 · 1025 阅读 · 0 评论 -
常用机器学习方法总结
http://blog.jobbole.com/89883/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条1.决策树算法决策树是一种树形分类结构,一棵决策树由内部结点和叶子结点构成,内部结点代表一个属性(或者一组属性),该结点的孩子代表这个属性的不同取值;叶子结点表示一个类标。决策树保证每一个实例都能被一条从根结点到叶子结点的路径转载 2015-09-12 10:22:48 · 596 阅读 · 0 评论 -
人肉工程在机器学习实践中的作用
http://blog.jobbole.com/90016/本文作者: 伯乐在线 - 水石头stone 。未经作者许可,禁止转载!欢迎加入伯乐在线作者团队。关于人肉工程,包括业务知识、领域知识,经验等,在实际的机器学习问题中的应用,是一个屡见不鲜的话题,典型的有苦逼的数据清洗、人肉特征工程等。大家都想把尽可能多的过程由机器自动完成,但是目前的状态是,大部分机器学习问题中转载 2015-09-12 10:42:30 · 412 阅读 · 0 评论 -
详细解释数据挖掘中的 10 大算法(下)
http://blog.jobbole.com/89037/本文由 伯乐在线 - 土豆粉ss 翻译,黄利民 校稿。未经许可,禁止转载!英文出处:Rayli。欢迎加入翻译组。上一篇中作者解释了 C4.5算法、K 均值聚类算法、支持向量机、Apriori 关联算法、EM 算法,下篇继续解释 PageRank 算法、AdaBoost 迭代算法、kNN 算法、朴素贝叶斯算法、C转载 2015-09-12 10:19:53 · 904 阅读 · 0 评论 -
数据挖掘(7):分类算法评价
http://blog.jobbole.com/90173/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条一、引言分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择分类,如何评价一个分类算法的好坏,前面关于决策树的介绍,我们主转载 2015-09-12 10:31:17 · 1111 阅读 · 0 评论 -
你应该掌握的七种回归技术
http://blog.jobbole.com/90021/原文出处: iteye 欢迎分享原创到伯乐头条什么是回归分析?回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通 事 故数量之间的关系,最好的研究方法就是回归。回归转载 2015-09-12 10:40:46 · 502 阅读 · 0 评论 -
龙星计划机器学习笔记 (转这篇文章是为了关注这个人的博客)
http://www.cnblogs.com/tornadomeet/archive/2012/11/12/2766458.html 前言 最近几周花了点时间学习了下今年暑假龙星计划的机器学习课程,具体的课程资料参考见附录。本课程选讲了写ML中的基本模型,同时还介绍了最近几年比较热门,比较新的算法,另外也将ML理论和实际问题结合了起来,比如将其应用在视觉上,web上的等。总之,虽转载 2015-09-15 11:53:34 · 1106 阅读 · 0 评论 -
自学数据挖掘
先记下,后面整理此文。参考了北大-msra联合互联网的数据挖掘课程 http://www.docin.com/p-714705030.html1,下面是实际的课程安排2,下面是参考书目原创 2015-09-16 23:11:02 · 620 阅读 · 0 评论 -
数据挖掘相关的数学基础
http://www.storagelab.org.cn/zhangdi/2014/01/12/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%9B%B8%E5%85%B3%E7%9A%84%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/最近我在看《数学之美》和《信息简史》两本书,感觉十分受用。计划在本博客内开放读书专栏,记转载 2015-09-16 22:56:53 · 2860 阅读 · 0 评论 -
10 种机器学习算法的要点(附 Python 和 R 代码)
http://blog.jobbole.com/92021/本文由 伯乐在线 - Agatha 翻译,唐尤华 校稿。未经许可,禁止转载!英文出处:SUNIL RAY。欢迎加入翻译组。前言谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。也许我们生活在人转载 2015-10-08 09:53:36 · 5161 阅读 · 1 评论 -
数据挖掘(8):朴素贝叶斯分类算法原理与实践
http://blog.jobbole.com/90177/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条隔了很久没有写数据挖掘系列的文章了,今天介绍一下朴素贝叶斯分类算法,讲一下基本原理,再以文本分类实践。 一个简单的例子朴素贝叶斯算法是一个典型的统计学习方法,主要理论基础就是一个贝叶斯公式,贝叶斯公式的基本定义转载 2015-09-12 10:32:11 · 965 阅读 · 0 评论 -
数据挖掘(6):决策树分类算法
http://blog.jobbole.com/90165/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。这篇先介绍分类问题的一些基本知识,然后主要讲述决策树转载 2015-09-12 10:30:16 · 2804 阅读 · 0 评论 -
数据挖掘导论读书笔记
数据原创 2015-06-01 10:06:35 · 915 阅读 · 0 评论 -
数据挖掘十大算法之Appriori算法
http://blog.csdn.net/qingdujun/article/details/465867211、引言 Appriori算法是用来干什么的?主要是用来解决类似于这样的问题:如果客户买了啤酒,他还会去买尿布吗?理论的核心: 频繁项目集的子集仍是频繁项目集;非频繁项目集的超集是非频繁项目集。这个理论一直作为经典的数据转载 2015-06-22 09:27:26 · 4269 阅读 · 0 评论 -
分类算法总结
http://blog.csdn.net/chl033/article/details/5204220目前看到的比较全面的分类算法,总结的还不错. 2.4.1 主要分类方法介绍解决分类问题的方法很多[40-42] ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boos转载 2015-06-23 11:33:28 · 533 阅读 · 0 评论 -
特征工程 vs. 特征提取
http://www.csdn.net/article/2015-08-07/2825416特征工程 vs. 特征提取:比赛开始!发表于2015-08-12 13:34| 690次阅读| 来源AppliedPredictiveDodeling| 0 条评论| 作者Max Kuhn, Kjell Johnson神经网络机器学习图像处理模式识别库摘要:特转载 2015-08-13 16:25:43 · 808 阅读 · 0 评论 -
详细解释数据挖掘中的 10 大算法(上)
http://blog.jobbole.com/90316/本文由 伯乐在线 - 土豆粉ss 翻译,黄利民 校稿。未经许可,禁止转载!英文出处:rayli。欢迎加入翻译组。在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。一旦你知道了这些算法是什么、怎么工作、能做什么、在哪里能找到,我希望你能把这篇博文当转载 2015-09-12 10:18:45 · 877 阅读 · 0 评论 -
数据挖掘(1):关联规则挖掘基本概念与Aprior算法
http://blog.jobbole.com/90121/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条我计划整理数据挖掘的基本概念和算法,包括关联规则挖掘、分类、聚类的常用算法,敬请期待。今天讲的是关联规则挖掘的最基本的知识。关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Apror转载 2015-09-12 10:24:41 · 1424 阅读 · 0 评论 -
数据挖掘(2):关联规则FpGrowth算法
http://blog.jobbole.com/90125/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条上一篇介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整转载 2015-09-12 10:25:38 · 1071 阅读 · 0 评论 -
数据挖掘(3):关联规则评价
http://blog.jobbole.com/90128/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条前面我们讨论的关联规则都是用支持度和自信度来评价的,如果一个规则的自信度高,我们就说它是一条强规则,但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。 一个误导我们的强规则看这样一个例子,我们转载 2015-09-12 10:26:58 · 946 阅读 · 0 评论 -
数据挖掘(4):使用weka做关联规则挖掘
http://blog.jobbole.com/90160/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条前面几篇介绍了关联规则的一些基本概念和两个基本算法,但实际在商业应用中,写算法反而比较少,理解数据,把握数据,利用工具才是重要的,前面的基础篇是对算法的理解,这篇将介绍开源利用数据挖掘工具weka进行管理规则挖掘。 wek转载 2015-09-12 10:28:15 · 1427 阅读 · 1 评论 -
数据挖掘(5):使用mahout做海量数据关联规则挖掘
http://blog.jobbole.com/90163/原文出处: fengfenggirl(@也爱数据挖掘) 欢迎分享原创到伯乐头条上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目(mahout本来是转载 2015-09-12 10:29:16 · 1016 阅读 · 0 评论 -
从头开始实现神经网络——入门
http://python.jobbole.com/82208/本文由 伯乐在线 - fzr 翻译,唐尤华 校稿。未经许可,禁止转载!英文出处:Denny Britz。欢迎加入翻译组。获取代码:接下来,为了匹配文章的内容,所有的代码都会在Github上以iPython笔记的形式提供。本文中我们会从头实现一个简单的3层神经网络。我们不会推导所有的数学公式,但会给我转载 2015-09-24 11:03:47 · 1504 阅读 · 0 评论