自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

sinltmin

职场小白 喜欢大数据、NLP

  • 博客(5)
  • 资源 (13)
  • 收藏
  • 关注

原创 KNN算法mapreduce实现

KNN算法Mapreduce实现目录KNN算法Mapreduce实现算法简介:mapreduce编程框架:具体实现过程:结果与分析算法简介:邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思...

2019-01-12 15:40:21 3650 2

原创 Mapreduce实现大数据集共现矩阵问题

目录相关知识简介共现矩阵的应用Mapreduce解决思路实现细节代码详解对于小文件的处理对于大文件的处理结果与分析相关知识简介共现矩阵的应用共现矩阵是许多语言模型中常用的技术之一,其主要应用于主题发现和解决词向量之间的相近关系的表示。假设现在有语料:“我爱吃西瓜” 和 “我喜欢吃西瓜” 分词得到 “我 爱 吃 西瓜” 、“我...

2019-06-17 08:36:21 905 1

原创 流数据处理Flume+Kafka的初步实现

目录实验目的实验内容实验过程Flume+kafka->storm(实时数据的处理结构)配置storm和zookeeper启动系统在eclipse中运行拓扑 实验目的 ​​​通过虚拟机配置Flume及Kafka,掌握Storm获得实际数据源的配置方法。通过虚拟机配置Kafka及编写kafkaSpout,掌握Storm获得实际数据源的配置方法。...

2019-06-14 08:36:46 555

原创 自动更新中科院的NLPIR/ICTCLAS分词系统证书

解决中科院的NLPIR/ICTCLAS分词系统证书过期问题问题描述:在使用中科院的NLPIR/ICTCLAS2016分词系统时时常会出现Cannot open Configure file 之类的问题,这是因为这个库将非商用期限设置为1个月,到期了就需要下载新的License。那么每次去github下载会非常麻烦,所以可以在使用这个工具之前,使用java自动检测并更新License呢...

2019-01-15 22:14:49 899

原创 nagios集成ganglia数据错误

错误提示:CHECKGANGLIA UNKNOWN: Error while getting value "Host/value not found"求大神指点

2017-12-31 17:42:20 321 2

SceneBuilder-11.0.0.zip

javafx GUI构建神器,请使用jdk11+

2021-01-30

storm流数据处理开发应用实战(linux实验环境,storm搭建完毕后的开发)

linux实验环境,storm搭建完毕后的开发。eclipse开发环境,大数据界hello world——wordcount详解,bolt、分组机制、storm DRPC详解

2019-06-20

KNN mapreduce实现

包含knn mapreduce环境下的实现全部代码和自定义输入输出文件格式。以及实验数据集。

2019-01-12

spark集群安装部署与初步开发

本资源从简介到开发,详细讲解了spark集群构建和初步开发,适合初学spark的或者学习了hadoop的,希望对大家有帮助。^_^

2018-09-12

mongodb高可用完全分布集群搭建

详细讲解mongodb高性能、高可用集群的搭建步骤,包括副本集与分片。每一步都有解释和说明,包括整个的集群结构,学习mongodb的不要错过这个资源

2018-09-12

hadoop mapreduce编程实战

此文档用于指导在hadoop完全分布式环境上做mapreduce开发,包括了11个mapreduce实例,讲解详细,适合初步接触mapreduce开发的同学,希望对大家有帮助

2018-09-12

hadoop开发环境搭建

此文档在hadoop集群搭建完毕之后,在集群之外搭建一个hadoop集群的开发环境,用于编写hadoop实际处理程序,还包括了如何提交任务等。整体非常详细,如需要其他hadoop集群搭建资源可以联系我,免费给q:1487954071

2018-09-12

hadoop完全分布式集群搭建

史上最详细的hadoop完全分布式集群搭建,适合初学大数据的新手。由于涉及到linux的安装什么的,需要另外linux系统安装详解资源的可以联系我,免费给q:1487954071

2018-09-12

flume+kafka+storm最完整讲解

详细讲解flume+kafka+spark实验环境搭建和测试例子,资源不能一次上传多个。需要更多资源可以免费给大家,q:1487954071

2018-09-12

spark-streaming-kafka

这个资源竟然不能免费给,┭┮﹏┭┮。这只是一个小资源,如果还需要其他spark、kafka、flume jar包可以联系我=

2018-09-12

集群运维clustershell

自己根据实验结果写的实验报告,每一步写的都很细致,需要的朋友可以看看,希望能帮到你们

2018-02-08

基于集群的HBase安装和配置

文档是我自己一步步完成实验写成的,给初学大数据的朋友共享一下希望能有所帮助

2018-02-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除