Hadoop安装后dataNode无法启动

安装好Hadoop后 在对应的解压文件夹中(就是你安装Hadoop的文件夹下)运行./sbin/statr-dfs.sh 后 查看jps会发现没有dataNode这个进程 附上报错的原因 java.io.IOException: Incompatible clusterIDs in /...

2017-10-27 15:47:15

阅读数 93

评论数 0

使用ssh免密远程登陆

由于要做hadoop的学习,想着先装一下, Hadoop一开始是为Linux开发使用的,所以在Linux上开发比较合适,并且一些公司也是在Linux上使用 首先先创建一个用户,这个就跳过了,因为要为练习Hadoop所以创建了一个用户,这里建议只要不用root来试都可以。(不懂那会经常用r...

2017-10-25 21:56:51

阅读数 138

评论数 0

R语言随机抽样

在机器学习中,有时候需要用一个数据集从中抽样一些子集用作验证或者建模,这个时候就需要用随机抽样查了查书下面写一下 sample()函数可以从数据集中有放回或者无放回的抽出大小为n的一个随机样本 使用方法   newdata 解释一下参数 第一个参数就是你的抽取数据集的...

2017-10-19 11:41:41

阅读数 1284

评论数 0

R语言朴素贝叶斯包的解释

最近做了点机器学习的东西,老师让用比较贝叶斯分离器,那就从最简单也是比较经典的朴素贝叶斯开始吧。 在R语言中是e1071包中的一个函数naiveBayes实现了朴素贝叶斯 这个函数有几个参数 慢慢解释 首先这个包的描述是:利用Bayes定理,计算出一个分类类变量的条件后验概率。这里是朴...

2017-10-18 21:31:14

阅读数 1764

评论数 0

机器学习常用到的一些算法

最近看了一些机器学习的文章,总结了总结,主要用到以下几种算法 经典机器学习的算法 1 回归算法, 分为线性回归这是得到的一个具体的连续的数值,逻辑回归 得到的是离散的结果,例如是否迟到这类的。 2 神经网络, 一层一层的把数据拆分,然后分给每个神经元来处理,越深入的就和原来的数据不同,越...

2017-08-22 09:42:24

阅读数 113

评论数 0

LeetCode之路第七题

本着为后面研究生铺路,必须把算法整明白,于是乎入了leetcode 算法第四版也在看,不过觉得不配合视频真的对推理证明不那么容易接受,后面的题答案后续也会贴上来。今天主要是为了分析一下刷题的第七题下面上题 Reverse digits of an integer.  Example1: x =...

2017-08-22 00:35:01

阅读数 270

评论数 0

监督学习和无监督学习

机器学习的常用方法,主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是...

2017-08-08 21:15:49

阅读数 140

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭