累了就歇一会

我在努力让自己变得更优秀

Hadoop,Scala,Spark环境配置

配置Hadoop 修改主机名 修改hosts 配置Java环境 解压安装 修改JAVA环境变量 测试安装是否成功 配置ssh ssh测试 ssh免密码登录 安装Hadoop 260 解压 移到指定目录 配置hadoop 验证 查看集群状态 查看hdfs 查看RM 运行WordCount程序 配置H...

2016-03-29 01:36:45

阅读数 2912

评论数 0

机器学习 - K-近邻算法(KNN)

基于实例的学习方法中,K-近邻算法算是最基本的了。K-近邻算法嘉定所有实例对应与n维空间中的点,一个实例的最近邻是根据标准欧氏距离定义的。例如把x表示为一个特征向量:< a1(x), a2(x), a3(x), ...an(x) >其中,ar(x)表示实例x的第r个属性值,所以xi和x...

2016-03-13 00:38:42

阅读数 1439

评论数 0

算法基础 - 树状数组(binary indexed tree)

定义 树状数组(Binary Indexed Tree(BIT), Fenwick Tree)是一个查询和修改复杂度都为log(n)的数据结构。主要用于查询任意两位之间的所有元素之和,但是每次只能修改一个元素的值;经过简单修改可以在log(n)的复杂度下进行范围修改,但是这时只能查询其中一个元...

2016-03-09 22:56:55

阅读数 839

评论数 0

机器学习 - Clustering by fast search and find of density peaks

为什么是英文标题呢,因为这个算法还没有正式的翻译,为2015年的Science上发表的一个算法。非常好,在我的论文里涉及到了这个算法的使用。这里记录一下这个算法。如果要英文原文的,就去谷歌搜索这个标题就好了。至于能不能免费看,要看有没有人提供或者购买。聚类算法本身聚类算法大家应该非常熟悉,聚类算法...

2016-03-02 14:04:30

阅读数 1597

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭