![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 95
感冒灵pp
这个作者很懒,什么都没留下…
展开
-
pyspark版GBDT+LR实现
主要是由于spark的python没有获取树节点的接口,只有基本的输出信息,需要手动建树。github是https://github.com/lhtlht/gbdt_lr后续再做详细的说明。原创 2019-11-19 23:10:35 · 1966 阅读 · 1 评论 -
Hadoop1.2.1详细配置与相关问题讲解
新手,折腾了一天,终于把HDFS配置好了,下面讲解所有流程以及我遇到的一些问题的解决方法。配置环境准备hadoop-1.2.1 --> HDFS伪分布式配置--> 1个NameNode节点,2个DateNode节点,1个SeconaryNode节点部署在3个虚拟机上系统--> VMWARE CentOS7.0(node1、node2、node3)系统准备原创 2017-08-23 12:16:28 · 1669 阅读 · 1 评论 -
Hadoop2.7.4详细配置与相关问题讲解
安装前准备node安装(这里使用VM12部署4个centos7.0系统,伪分布式部署)jdk安装 (我这里使用的是jdk1.8)ssh免密码登录参考我的上一篇Hadoop1.2.1详细配置与相关问题讲解 有详细说明,这里就不再累赘。环境说明主机hosts:node1 192.168.132.138 node2 192.168.132.139node3 192原创 2017-08-27 11:42:33 · 3633 阅读 · 2 评论