![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
machine learning
文章平均质量分 81
noobzc1
这个作者很懒,什么都没留下…
展开
-
Prismatic:用机器学习分析用户兴趣只需10秒钟
摘要:斯坦福大学和伯克利的四位年轻的计算机科学博士创立了Prismatic。他们不仅是科学家同时也是实干家,他们放弃了Hadoop等重量级框架,通过过程化语言的深度使用,简单并且高效的实现了大数据的处理,高度并发,实时等优异的特性。这篇文章主要描述的是Prismatic公司系统架构,作者是Todd Hoff,本文出自Todd对Prismatic的程序员Jason Wolfe的邮件专访。关于转载 2013-01-04 02:22:18 · 835 阅读 · 0 评论 -
K-means算法的java实现,聚类分析681个三国武将
一,k-means算法介绍: k-means算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。 k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类转载 2013-03-07 23:02:54 · 1187 阅读 · 0 评论 -
基于Map/Reduce的频繁项集挖掘
云计算是分布式计算技术的一种,其最基本的概念是透过网络将庞大的计算处理程序自动拆成无数个较小的子程序,再交由多服务崧所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。云计算具有超大规模、虚拟化、高可靠性、高可扩展性、通用性等特点,在海量数据的处理中有着重要的地位和发展空间。云计算普遍采用的编程模式是MapReduce,它由Google提出,为编写需要大规模并行处理的代码提供了简单模式L。转载 2013-03-07 22:13:56 · 5050 阅读 · 1 评论 -
Porter Algorithm ---------词干提取算法
在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法,也叫波特词干器(Porter Stemmer)。详见转载 2013-05-08 22:38:40 · 6680 阅读 · 0 评论 -
singular value decomposition----SVD
潜在语义索引(Latent Semantic Indexing)是一个严重依赖于SVD的算法,本文转载自之前吴军老师《数学之美》和参考文献《机器学习中的数学》汇总。————————————在自然语言处理中,最常见的两类的分类问题分别是,将文本按主题归类(比如将所有介绍亚运会的新闻归到体育类)和将词汇表中的字词按意思归类(比如将各种体育运动的名称个归成一类)。这两种分类问题都可用通过矩阵运算转载 2013-05-30 22:23:23 · 532 阅读 · 0 评论 -
Bayesain Networks
2.2、重新考虑上一篇的例子 上一篇文章我们使用朴素贝叶斯分类实现了SNS社区中不真实账号的检测。在那个解决方案中,我做了如下假设: i、真实账号比非真实账号平均具有更大的日志密度、各大的好友密度以及更多的使用真实头像。 ii、日志密度、好友密度和是否使用真实头像在账号真实性给定的条件下是独立的。 但是,上述第二条假设很可能并不成立。一般来说转载 2013-10-14 11:44:05 · 745 阅读 · 0 评论 -
MinHash
1.概述 跟SimHash一样,MinHash也是LSH的一种,可以用来快速估算两个集合的相似度。MinHash由Andrei Broder提出,最初用于在搜索引擎中检测重复网页。它也可以应用于大规模聚类问题。2.Jaccard index 在介绍MinHash之前,我们先介绍下Jaccard index。转载 2013-10-14 11:38:14 · 912 阅读 · 0 评论 -
Naive Bayesian classification
1.1、摘要 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分类问题进行一个正式的定义。然后,介绍贝叶斯分类算法的基础——贝叶斯定理。最后,通过实例讨论贝叶斯分类中最简单的一种:朴素贝叶斯分类。1.2、分类问题综述 对于分类问题,其实谁都不会陌生,说我们每个人每天都在执行分类操作一点转载 2013-10-14 11:41:37 · 821 阅读 · 0 评论