- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 随机森林和GBDT的区别
一,随机森林随机森林是一个用随机方式建立的,包含多个决策树的集成分类器。其输出的类别由各个树投票而定(如果是回归树则取平均)。假设样本总数为n,每个样本的特征数为a,则随机森林的生成过程如下:从原始样本中采用有放回抽样的方法选取n个样本; 对n个样本选取a个特征中的随机k个,用建立决策树的方法获得最佳分割点;重复m次,获得m个决策树; 对输入样例进行预测时,每个子树都产生一个结果,采用多数投
2017-06-30 00:20:54 37968 3
原创 Java中String、StringBuffer、StringBuilder的区别
1,可变与不可变首先三者的类都是final修饰的,因此不能被继承。 String类中使用字符数组保存字符串,格式为private final char value[],因为有“final”修饰符,所以可以知道string对象是不可变的。 StringBuilder与StringBuffer都继承自AbstractStringBuilder抽象类,它定义了一些字符串的基本操作,如expandCap
2017-06-29 23:52:45 1027
原创 MapReduce练习二(单表关联,多表关联,倒排索引)
相关链接: MapReduce练习一(计数,去重,排序,平均成绩) MapReduce练习二(单表关联,多表关联,倒排索引) 一些省略的代码可以在练习一中找到。一,单表关联要求:给出child-parent(孩子—父母)表,要求输出grandchild-grandparent(孙子—爷奶)表。Map输出2个表,第一个表key为父母,设一个标识位tag=L,value为tag+孩子+父母,称为左
2017-06-28 23:51:22 2687
原创 MapReduce练习一(计数,去重,排序,平均成绩)
相关链接: MapReduce练习一(计数,去重,排序,平均成绩) MapReduce练习二(单表关联,多表关联,倒排索引)公司服务器的Hadoop版本是0.20,把hadoop-eclipse-plugin-0.20的jar包放到eclipse安装目录下的plugins目录中,新建项目,导入这个jar包解压之后得到的jar包,本地写代码,写完弄成jar包送服务器运行,注意jar包是在服务器的,
2017-06-28 23:13:36 2068
etc文件下mysql的配置文件
2017-05-22
mingw64安装程序
2017-05-16
已经编译好的xgboost
2017-05-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人