![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习&数据挖掘
文章平均质量分 74
Sky_Money
这个作者很懒,什么都没留下…
展开
-
Mahout初体验——配置+HelloWorld
最近在看机器学习方面的内容,不过一直在看理论方面未免略枯燥,正好发现了一个Apache下的开源项目——Mahout,是一个Java的机器学习算法库,遂看之。Mahout的主页Apache Mahout,正如其主要介绍的,这是一个Scalable Machine Learning库,而且基于Map/Reduce,可运行在Hadoop集群上。事实上它提供的库就有两种,一种是单机版的,独立运行在原创 2012-08-02 20:53:16 · 6020 阅读 · 2 评论 -
数据挖掘读书笔记一——数据认识
最近偏重看数据挖掘方面的知识,整了本韩家炜的《数据挖掘》慢慢研究,特整理此系列作为读书随笔。第一篇是数据的相关知识,对应书上的第二章,主要讲述了数据有关基础的内容,和统计线性代数相关。Part1,数据基础一,数据属性与类别属性简介从广义上来讲,数据集中包含了每一个数据对象,每一个数据对象代表了一个实体,这倒颇有一点OO的思想。对于任何一个数据,如原创 2012-10-24 13:59:19 · 3703 阅读 · 0 评论 -
Python写一个简洁拼写检查器
网上看到的一篇神文,利用的是朴素贝叶斯模型实现了一个简单的拼写检查器。英文原文链接见这里,中文翻译如下====================================================================================================================================怎样写一个转载 2012-09-11 20:08:41 · 6680 阅读 · 1 评论 -
数据挖掘随笔记录一
数据挖掘应用领域里存在四种完全不同的学习方式。1,分类学习(classification learning)是用一个已分类的样本集来表示学习方案,并希望从这个样本集中学习对未来样本进行分类的方法。这个感觉就类似机器学习中的监督学习(supervised learning),从给定的训练集和结果中训练得到。2,关联学习(association learning):寻找任何特性之间的关联,原创 2012-09-07 15:04:19 · 666 阅读 · 0 评论 -
EM算法简介
最近看分类方面的内容,目前接触的一些算法主要是k-means算法和EM算法,k-means算法还好,比较容易理解,而EM算法第一次看则是一头雾水(菜鸟一枚啊~~~),网上找了几个讲解,记录一下。===================================================================================================转载 2012-08-25 22:54:27 · 771 阅读 · 0 评论 -
机器学习阶段总结一
最近一直在看机器学习相关内容,主要是看的斯坦福的Andrew Ng教授的公开课视频,可以点这里看了前四讲,最大的感觉就是这简直就是概率论+线代,用到的数学知识着实不少,不过也挺有趣的,继续学下去。初步总结一下,主要是关于监督学习,回归分类方面的。1,机器学习中主要有两个基本的学习方法:监督学习和非监督学习。简单来说,监督学习是告诉了机器某个训练集并且指明了这个集中每个训练样本的特征原创 2012-08-25 16:09:58 · 1244 阅读 · 0 评论 -
KNN ( K最近邻法) 原理。
Posted By Mr. Thursday 各位看到標題,如果沒有聽過KNN演算法,會不會覺得疑惑:KNN是甚麼呢?是不是CNN看久了,就變成DNN、ENN、最後變成KNN了呢?當然不是啦 XD!KNN全名是k-th nearest neighbor,中文意思是「第k位最接近的鄰居」。甚麼是「第k位最接近的鄰居」呢?假設在一個廣場上,有100個朋友,每位朋友都是你的鄰居,最接近你的鄰居,转载 2012-07-28 10:08:59 · 6007 阅读 · 1 评论 -
生成模型和判别模型
今天看了斯坦福机器学习课程的第五讲,有提到生成学习,看了下,之前所讲的是各种回归分类问题属于判别模型,这两者一定要熟悉。对于样本的学习主要有两种方式,就是生成学习和判别学习。简单来说,根绝学习过程中的focus点来划分。对于判别学习,主要是focus在 p(y|x)上,也就是根据给定一个观察值,给出这个值属于某个域的概率,这其实和我们正常的思维差不多,比如观察到一只狮子,要判断原创 2012-08-09 15:02:13 · 907 阅读 · 0 评论