![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 75
不碌
做自己喜欢的事
展开
-
MapReduce FileInputFormat读取两个文件顺序
在用mapreduce写电影推荐系统,需求是将两个矩阵合并,但是读取有顺序,因为要先将第一个文件的数据存到数组。写的时候发现总会先读第二个文件,改了文件目录的先后也没有改变,改了文件大小也没变。之后我改了文件名称,对了!原因猜测是读取是按照文件名字符序读取的。...原创 2019-11-28 13:31:43 · 421 阅读 · 0 评论 -
Mac hive更换IP地址之后
Mac hive更换IP地址之后学习hadoop过程中一直在用macos系统在学习,有一个问题是IP地址一直在变化,更换IP之后需要进入/etc更改hosts的IP地址今天更换IP之后爆出错误ERROR [ddc658f0-5f45-42af-8383-88f93872c9ce main] ql.Driver: FAILED:HiveAccessControlException Perm...原创 2019-01-18 17:14:45 · 658 阅读 · 1 评论 -
数据挖掘领域十大经典算法之—C4.5算法(超详细附JAVA代码)
直接说一下代码节点类一个节点里面包含no,yes 节点矩阵里结果的数量,比如这个用户买就是yes不买就是nojudgeConditions 最后建成决策树代入数据判断条件 比如是0 那么如果数据属性值是0就经过这个节点classificationNum 这个节点分裂属性类别个数target 分裂属性的列数isLeaf 节点是否是叶子节点class Node{ int no;...原创 2019-06-13 18:47:11 · 1300 阅读 · 0 评论