![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 95
感冒灵pp
这个作者很懒,什么都没留下…
展开
-
pyspark版GBDT+LR实现
主要是由于spark的python没有获取树节点的接口,只有基本的输出信息,需要手动建树。 github是https://github.com/lhtlht/gbdt_lr 后续再做详细的说明。原创 2019-11-19 23:10:35 · 1971 阅读 · 1 评论 -
Hadoop1.2.1详细配置与相关问题讲解
新手,折腾了一天,终于把HDFS配置好了,下面讲解所有流程以及我遇到的一些问题的解决方法。 配置环境准备 hadoop-1.2.1 --> HDFS 伪分布式配置 --> 1个NameNode节点,2个DateNode节点,1个SeconaryNode节点部署在3个虚拟机上 系统 --> VMWARE CentOS7.0(node1、node2、node3) 系统准备原创 2017-08-23 12:16:28 · 1672 阅读 · 1 评论 -
Hadoop2.7.4详细配置与相关问题讲解
安装前准备 node安装(这里使用VM12部署4个centos7.0系统,伪分布式部署) jdk安装 (我这里使用的是jdk1.8) ssh免密码登录 参考我的上一篇Hadoop1.2.1详细配置与相关问题讲解 有详细说明,这里就不再累赘。 环境说明 主机hosts: node1 192.168.132.138 node2 192.168.132.139 node3 192原创 2017-08-27 11:42:33 · 3636 阅读 · 2 评论