自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (14)
  • 收藏
  • 关注

原创 mllib之随机森林与梯度提升树

随机森林和GBTs都是集成学习算法,它们通过集成多棵决策树来实现强分类器。集成学习方法就是基于其他的机器学习算法,并把它们有效的组合起来的一种机器学习算法。组合产生的算法相比其中任何一种算法模型更强大、准确。随机森林和梯度提升树(GBTs)。两者之间主要差别在于每棵树训练的顺序。随机森林通过对数据随机采样来单独训练每一棵树。这种随机性也使得模型相对于单决策树更健壮,

2015-04-13 21:53:22 2354 1

原创 mllib:Exception in thread "main" org.apache.spark.SparkException: Input validation failed.

当我们使用mllib做分类,用到逻辑回归或线性支持向量机做分类时,可能会出现下面的错误:15/04/09 21:27:25 ERROR DataValidators: Classification labels should be 0 or 1. Found 3000000 invalid labelsException in thread "main" org.apache.spark.S

2015-04-09 22:31:30 3545 1

原创 mllib:java.lang.IllegalArgumentException: GiniAggregator given label 2.0 but requires label < numCla

报错信息 : java.lang.IllegalArgumentException: GiniAggregator given label 2.0 but requires label 在用mllib做分类,当用到一些分类算法时,常常需要加入基尼系数。程序代码:RandomForest.trainClassifier(validData,2,Map[In

2015-04-09 21:16:31 3966

雍俊海java程序设计教程(第2版).rar

雍俊海java程序设计教程(第2版).rar

2014-07-20

精通Hadoop

精通Hadoop,Hadoop学习不错的一本书。

2014-03-01

Hadoop测试题

本文档是对自己学习hadoop的一个小测试,适合初学hadoop的人士观看。

2014-02-17

Hive用户指南

本文档是hive用户指南,适合hive操作的用户查看。

2014-02-17

C#聊天室完整源码

此为主要由C#实现的聊天室的功能,有需要的可以看看。

2014-02-17

200个C程序

本资源为200个C语言基本的例题,方便初学C语言的同学学习。

2014-02-17

C#版彩色连珠小游戏

C#实现的彩色连珠小游戏的文档,适合初学C#的学生观看。

2014-02-17

asp.net留言板项目源码

本系统是asp.net实现的留言板的功能,方便学习C#的初学者观看。

2014-02-17

C#图书馆源码

本资源是图书馆的源码,此项目使用C#语言开发。方便于初学者观看。

2014-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除