自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

乖兔子的专栏

不积跬步,无以至千里!

  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 LDA理解以及源码分析(二)

LDA系列的讲解分多个博文给出,主要大纲如下:LDA相关的基础知识 什么是共轭multinomial分布Dirichlet分布LDA in text LAD的概率图模型LDA的参数推导伪代码GibbsLDA++-0.2源码分析Python实现GibbsLDA参考资料GibbsLDA++-0.2源码分析GibbsLDA++-0.2工具包下载地址为:下载工具包里docs文件夹里有

2015-12-09 17:31:13 6790 1

原创 LDA理解以及源码分析(一)

LDA系列的讲解分多个博文给出,主要大纲如下:LDA相关的基础知识 什么是共轭multinomial分布Dirichlet分布LDA in text LAD的概率图模型LDA的参数推导伪代码GibbsLDA++-0.2源码分析Python实现GibbsLDA参考资料LDA相关的基础知识LDA是Blei于2002年发表的概率语言模型,被广泛应用于主题建模中,通过对文本进行潜语义

2015-12-09 17:27:15 17263 1

原创 Spark LDA

关于LDA的理论部分,参考其他博客(链接待定),本文主要记录spark中LDA的实现。spark1.4版本的LDA原文比较简单,下面主要是以翻译官网为主。理论部分LDA是一个主题模型,它能够推理出一个文本文档集合的主题。LDA可以认为是一个聚类算法,原因如下:主题对应聚类中心,文档对应数据集中的样本(数据行)主题和文档都在一个特征空间中,其特征向量是词频向量跟使用传统的距离来评估聚类不一样的是

2015-12-08 16:59:33 9765

原创 Intellij搭建spark开发环境

spark怎么学习呢?在一无所知的前提下,首先去官网快速了解一下spark是干什么的,官网在此。然后,安装开发环境,从wordcount开始学习。第三,上手以后可以学习其他算法了。最后,不要放弃,继续深入学习。那么,首先解决的就是如何搭建开发环境的问题。1、确保你的电脑安装了JDK,以及配置了JAVA_HOME环境变量。2、安装Intellij IDEA,下载地址。目前15.0版本对Scala的支持

2015-12-08 11:18:42 19666 1

俄罗斯方块VB源代码

完整的工程文件、源代码以及可执行文件,可以直接编译运行,简单的实现了俄罗斯方块的全功能。

2010-03-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除