自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Hadoop安装后dataNode无法启动

安装好Hadoop后 在对应的解压文件夹中(就是你安装Hadoop的文件夹下)运行./sbin/statr-dfs.sh 后 查看jps会发现没有dataNode这个进程附上报错的原因java.io.IOException: Incompatible clusterIDs in /usr/local/hadoop/tmp/dfs/data: namenode clusterID =

2017-10-27 15:47:15 230

原创 使用ssh免密远程登陆

由于要做hadoop的学习,想着先装一下, Hadoop一开始是为Linux开发使用的,所以在Linux上开发比较合适,并且一些公司也是在Linux上使用首先先创建一个用户,这个就跳过了,因为要为练习Hadoop所以创建了一个用户,这里建议只要不用root来试都可以。(不懂那会经常用root实验,结果一个自杀命令让自己机子直接崩了)ok进入正题,ssh是什么 下面的内容来自

2017-10-25 21:56:51 292

原创 R语言随机抽样

在机器学习中,有时候需要用一个数据集从中抽样一些子集用作验证或者建模,这个时候就需要用随机抽样查了查书下面写一下sample()函数可以从数据集中有放回或者无放回的抽出大小为n的一个随机样本使用方法   newdata解释一下参数 第一个参数就是你的抽取数据集的怎么构成,这需要是向量,第二个参数是抽取的元素数量,最后一个表示是否放回的抽取这只是一个简

2017-10-19 11:41:41 8196

原创 R语言朴素贝叶斯包的解释

最近做了点机器学习的东西,老师让用比较贝叶斯分离器,那就从最简单也是比较经典的朴素贝叶斯开始吧。在R语言中是e1071包中的一个函数naiveBayes实现了朴素贝叶斯 这个函数有几个参数 慢慢解释首先这个包的描述是:利用Bayes定理,计算出一个分类类变量的条件后验概率。这里是朴素贝叶斯所以也就假定每条数据的特征值的属性是独立无关的,不过有些论文也指出弱相关的时候也可以很好的分类

2017-10-18 21:31:14 4515

原创 机器学习常用到的一些算法

最近看了一些机器学习的文章,总结了总结,主要用到以下几种算法经典机器学习的算法1 回归算法, 分为线性回归这是得到的一个具体的连续的数值,逻辑回归 得到的是离散的结果,例如是否迟到这类的。2 神经网络, 一层一层的把数据拆分,然后分给每个神经元来处理,越深入的就和原来的数据不同,越是单一和简单类似于一个原子3 svm支持向量机 逻辑回归算法的强化,通过与高斯“核”结合可以表达出

2017-08-22 09:42:24 227

原创 LeetCode之路第七题

本着为后面研究生铺路,必须把算法整明白,于是乎入了leetcode 算法第四版也在看,不过觉得不配合视频真的对推理证明不那么容易接受,后面的题答案后续也会贴上来。今天主要是为了分析一下刷题的第七题下面上题Reverse digits of an integer. Example1: x = 123, return 321 Example2: x = -123, return -

2017-08-22 00:35:01 536

转载 监督学习和无监督学习

机器学习的常用方法,主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有

2017-08-08 21:15:49 276

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除