![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Spark
文章平均质量分 86
zchenack
这个作者很懒,什么都没留下…
展开
-
Spark安装搭建与使用
Spark安装搭建与使用Spark安装搭建与使用 Spark简介 Spark框架 Spark常见API功能 Spark RDD Spark下载与安装 Spark windows集成开发环境搭建 利用Spark调用Ansj进行中文分词Spark简介Apache Spark是一个开源分布式的数据处理平台,支持集群进行数据处理。类似于hadoop,却又能提供灵活的编程接口(而不是map和reduce过程)原创 2017-10-28 15:31:40 · 955 阅读 · 0 评论 -
Spark中文文本聚类
Spark文本聚类Spark文本聚类 Spark mlib简介 中文文本分词 TFIDF特征 word2vec介绍 文本表示 Kmeans LDA聚类聚类是常见的无监督学习算法,用于找到相似的Item,在无标记数据的情况下经常使用。这里考虑,当我们拥有大量文本,需要找到相似的文本(粗分类)时,使用Spark进行实验。Spark mlib简介mlib是Spark提供的机器学习算法库,提供特征工程、分类原创 2017-11-17 20:21:33 · 3152 阅读 · 0 评论 -
ubuntu搭建Hadoop-2.2.0(单机)
对于Hadoop的搭建,需要事先安装Java 与 SSH原创 2014-06-05 16:55:20 · 462 阅读 · 0 评论