红红火火恍恍惚惚-CSDN博客

原创 spark-mllib-lda 实践与说明

spark中mllib机器学习库下lda算法实例及说明

2016-10-01 21:11:46 5459 2

原创分类算法简述

分类算法简述一、什么是分类算法数据挖掘任务通常分为两大类：预测任务，根据其他属性的值，预测特定属性的值。描述任务，概括数据中潜在联系的模式（相关性，趋势，聚类，轨迹和异常）　　分类属于预测任务，就是通过已有数据集（训练集）的学习，得到一个目标函数f（模型），把每个属性集x映射到目标属性y（类），且y必须是离散的（若y为连续的，则属于回归算法）。二、分类的基本流程1、模型建立　　分类过程首先

2016-05-21 16:56:32 43033

原创 ID3、C4.5算法介绍以及java代码实现

ID3、C4.5算法介绍

2015-09-28 21:42:54 10697

转载 pLSA/mixture unigram/gmm em算法公式汇总

1、LSA（隐性语义分析）和SVD（奇异值分解）在VSM(文档空间向量模型中)在文章看做词袋的集合，将文档转换为同一空间向量进行计算，聚类，分类，文本检索是减少计算量，但是难以考虑文档位置以及文档的一词多义性。基于SVD分解，我们可以构造一个原始向量矩阵的一个低秩逼近矩阵，具体的做法是将词项文档矩阵做SVD分解其中是以词项(terms)为行, 文档(documents)为列做一个大矩阵. 设一

2015-09-22 19:21:58 1075

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 spark-mllib-lda 实践与说明

原创 分类算法简述

原创 ID3、C4.5算法介绍以及java代码实现

转载 pLSA/mixture unigram/gmm em算法公式汇总

空空如也

空空如也

原创分类算法简述