- 博客(5)
- 收藏
- 关注
转载 Kmeans聚类算法-二维度数组(Java实现)
本文章转载至:http://blog.csdn.net/cyxlzzs/article/details/7416491源码Kmeans.java文件源码如下:package com.bigdata.ml.cluster;import java.util.ArrayList;import java.util.Random;/** * 聚类算法通常用于数据挖掘,将相似的数组进行
2015-09-30 14:55:16 4345
原创 基于密度的局部离群点检测(lof算法) (Java 实现)
算法:基于密度的局部离群点检测(lof算法)输入:样本集合D,正整数K(用于计算第K距离)输出:各样本点的局部离群点因子过程:1, 计算每个对象与其他对象的欧几里得距离2, 对欧几里得距离进行排序,计算第k距离以及第K领域3, 计算每个对象的可达密度4, 计算每个对象的局部离群点因子5, 对每个点的局部离群点因子进行排序,输出。
2015-09-30 14:48:41 12783 9
原创 Oracle常用查询
1,查询表空间使用情况 select b.file_id 文件ID号, b.tablespace_name 表空间名, b.bytes/1024/1024||’M’字节数, (b.bytes-sum(nvl(a.bytes,0)))/1024/1024||’M’ 已使用, sum(nvl(a.bytes,0))/1024/1024||’M’ 剩余空间, 100 - sum(
2015-09-25 13:46:50 460
原创 Impala之概念及架构
Impala服务器是一个分布式,大规模并行处理(MPP)数据库引擎。它包括运行在CDH集群主机上的不同后台进程。Impala DaemonImpala Daemon进程是运行在集群每个节点上的守护进程,是Impala的核心组件之一。每个节点上这个进程名称为impalad。impalad 负责读写数据文件,接受来自impala-shell、Hue、JDBC或者ODBC的查询请求,与集
2015-09-22 10:45:12 5004
原创 Linux之cron任务
一. Crontab 介绍 crontab命令的功能是在一定的时间间隔调度一些命令的执行。1.1 /etc/crontab 文件在/etc目录下有一个crontab文件,这里存放有系统运行的一些调度程序。每个用户可以建立自己的调度crontab。[root@cdh-node3 etc]# cat /etc/crontab SHELL=/bin/bashPA
2015-09-15 10:22:56 669
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人