自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 spark-mllib-lda 实践与说明

spark中mllib机器学习库下lda算法实例及说明

2016-10-01 21:11:46 5332 2

原创 分类算法简述

分类算法简述一、什么是分类算法数据挖掘任务通常分为两大类:预测任务,根据其他属性的值,预测特定属性的值。描述任务,概括数据中潜在联系的模式(相关性,趋势,聚类,轨迹和异常)   分类属于预测任务,就是通过已有数据集(训练集)的学习,得到一个目标函数f(模型),把每个属性集x映射到目标属性y(类),且y必须是离散的(若y为连续的,则属于回归算法)。二、分类的基本流程1、模型建立  分类过程首先

2016-05-21 16:56:32 42597

原创 ID3、C4.5算法介绍以及java代码实现

ID3、C4.5算法介绍

2015-09-28 21:42:54 10508 6

转载 pLSA/mixture unigram/gmm em算法公式汇总

1、LSA(隐性语义分析)和SVD(奇异值分解)在VSM(文档空间向量模型中)在文章看做词袋的集合,将文档转换为同一空间向量进行计算,聚类,分类,文本检索是减少计算量,但是难以考虑文档位置以及文档的一词多义性。 基于SVD分解,我们可以构造一个原始向量矩阵的一个低秩逼近矩阵,具体的做法是将词项文档矩阵做SVD分解其中 是以词项(terms)为行, 文档(documents)为列做一个大矩阵. 设一

2015-09-22 19:21:58 984

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除