自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

钱大鑫的博客

逗逼一个!

  • 博客(7)
  • 收藏
  • 关注

转载 Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

1.  问题导读:     Failed to locate the winutils binary in the hadoop binary path     java.io.IOException: Could not locate executablenull\bin\winutils.exe in the Hadoop binaries.2.  问题解决:      仔细查看报错是缺少wi...

2018-03-23 17:40:24 252

原创 数据挖掘/机器学习算法--直接聚类算法(k-means)

大家好!我是钱大鑫!本篇博客我主要跟大家探讨一下经典聚类算法——k-means。还是那句话,学习算法不是一件可以瞬间学会的事情,大家慢慢读,慢慢领悟,内容绝大部分为会设计到一些数学知识,算法嘛,正常的!读完记得自己实践一下,好了,废话不多说,我们直接来看k-means算法。        k−means \ k-means\ 算法是实践中使用最广泛的聚类算法。该算法具有简单、易懂、良好的可伸缩性等显

2017-03-22 11:49:49 4543

原创 数据挖掘/机器学习算法--C4.5以及决策树(Decision Tree)

我在写这篇博客的时候借鉴了网络上一位博主对于决策树的理解,稍加补充,对其代码稍作修改,并在此详细介绍一下决策树和C4.5分类算法。希望观看的同学能静下心来好好阅读以下文字,毕竟对于算法来说,概念也是相当重要的。好了,废话不多说了,我们直接进入主题。       C4.5算法是机器学习和数据挖掘领域中的一整套用于处理分类问题的算法。该算法是有监督学习类型的,即:给定一个数据集,所有实例都由一组属性来描

2017-03-04 15:15:44 3232

原创 hadoop-2.5.0源码编译

hadoop 源码编译

2016-09-18 17:15:43 1265

原创 hadoop伪分布式环境搭建与测试

hadoop 伪分布式 集群部署

2016-09-18 17:09:46 1368

原创 Ubuntu14.04下maven3.3.9的安装与测试

Maven, 是基于项目对象模型(Project Object Model, POM),通过一小段描述信息来管理项目的构建,报告,文档的软件项目管理工具。目前,绝大多数开发人员都把 Ant 当作 Java 编程项目的标准构建工具。但是,Ant 的项目管理工具(作为 make的替代工具)不能满足绝大多数开发人员的需要。通过检查 Ant 构建文件,很难发现项目的相关性信息和其它元信息(如开发人

2016-05-18 18:01:45 941

原创 Hadoop初识--Hadoop单机模式安装和环境配置

对hadoop的安装、配置、环境搭建作了一些整理,对于安装过程中遇到的问题作了一些解决。

2016-04-15 19:31:34 5706

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除