- 博客(7)
- 收藏
- 关注
原创 MapReduce FileInputFormat读取两个文件顺序
在用mapreduce写电影推荐系统,需求是将两个矩阵合并,但是读取有顺序,因为要先将第一个文件的数据存到数组。写的时候发现总会先读第二个文件,改了文件目录的先后也没有改变,改了文件大小也没变。之后我改了文件名称,对了!原因猜测是读取是按照文件名字符序读取的。...
2019-11-28 13:31:43 432
原创 数据挖掘领域十大经典算法之—C4.5算法(超详细附JAVA代码)
直接说一下代码节点类一个节点里面包含no,yes 节点矩阵里结果的数量,比如这个用户买就是yes不买就是nojudgeConditions 最后建成决策树代入数据判断条件 比如是0 那么如果数据属性值是0就经过这个节点classificationNum 这个节点分裂属性类别个数target 分裂属性的列数isLeaf 节点是否是叶子节点class Node{ int no;...
2019-06-13 18:47:11 1350
原创 Mac hive更换IP地址之后
Mac hive更换IP地址之后学习hadoop过程中一直在用macos系统在学习,有一个问题是IP地址一直在变化,更换IP之后需要进入/etc更改hosts的IP地址今天更换IP之后爆出错误ERROR [ddc658f0-5f45-42af-8383-88f93872c9ce main] ql.Driver: FAILED:HiveAccessControlException Perm...
2019-01-18 17:14:45 678 1
原创 jsmartcom_zh_CN.jar下载免费
jsmartcom_zh_CN.jar下载免费链接:https://pan.baidu.com/s/1whHO7vFpjs4K20FJZ9f5_A 密码:8p1o
2020-03-22 20:21:59 1039 3
原创 df
import warningsfrom sklearn import preprocessingfrom sklearn.externals import joblibfrom sklearn.svm import SVCfrom sklearn import treefrom sklearn.ensemble import RandomForestClassifierfrom skl...
2019-11-02 12:50:18 739 1
原创 python已正确安装numpy,pandas但无法调用
安装pandas之后显示确定python编译器(pycharm)用的是python3,终端显示已经安装,进入Preferences,搜索Project Interpreter从这就可以看出当前安装了那些发现我安装了两个版本,换一个版本运行无误了...
2019-07-31 14:46:39 9337 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人