自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

邹中凡

Focus on AI & Big Data

  • 博客(5)
  • 收藏
  • 关注

转载 Kmeans聚类算法-二维度数组(Java实现)

本文章转载至:http://blog.csdn.net/cyxlzzs/article/details/7416491源码Kmeans.java文件源码如下:package com.bigdata.ml.cluster;import java.util.ArrayList;import java.util.Random;/** * 聚类算法通常用于数据挖掘,将相似的数组进行

2015-09-30 14:55:16 4345

原创 基于密度的局部离群点检测(lof算法) (Java 实现)

算法:基于密度的局部离群点检测(lof算法)输入:样本集合D,正整数K(用于计算第K距离)输出:各样本点的局部离群点因子过程:1,    计算每个对象与其他对象的欧几里得距离2,    对欧几里得距离进行排序,计算第k距离以及第K领域3,    计算每个对象的可达密度4,    计算每个对象的局部离群点因子5,    对每个点的局部离群点因子进行排序,输出。

2015-09-30 14:48:41 12783 9

原创 Oracle常用查询

1,查询表空间使用情况 select b.file_id 文件ID号, b.tablespace_name 表空间名, b.bytes/1024/1024||’M’字节数, (b.bytes-sum(nvl(a.bytes,0)))/1024/1024||’M’ 已使用, sum(nvl(a.bytes,0))/1024/1024||’M’ 剩余空间, 100 - sum(

2015-09-25 13:46:50 460

原创 Impala之概念及架构

Impala服务器是一个分布式,大规模并行处理(MPP)数据库引擎。它包括运行在CDH集群主机上的不同后台进程。Impala DaemonImpala Daemon进程是运行在集群每个节点上的守护进程,是Impala的核心组件之一。每个节点上这个进程名称为impalad。impalad 负责读写数据文件,接受来自impala-shell、Hue、JDBC或者ODBC的查询请求,与集

2015-09-22 10:45:12 5004

原创 Linux之cron任务

一.  Crontab 介绍 crontab命令的功能是在一定的时间间隔调度一些命令的执行。1.1 /etc/crontab 文件在/etc目录下有一个crontab文件,这里存放有系统运行的一些调度程序。每个用户可以建立自己的调度crontab。[root@cdh-node3 etc]# cat /etc/crontab SHELL=/bin/bashPA

2015-09-15 10:22:56 669

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除