算法
文章平均质量分 54
一世为仁
要是有来生,做一棵树可好?
展开
-
一种新聚类算法
今年 6 月份,Alex Rodriguez 和 Alessandro Laio 在 Science 上发表了一篇名为《Clustering by fast search and find of density peaks》的文章,为聚类算法的设计提供了一种新的思路。虽然文章出来后遭到了众多读者的质疑,但整体而言,新聚类算法的基本思想很新颖,且简单明快,值得学习。这个新聚类算法的核心思想在于对聚类转载 2016-07-11 22:42:10 · 1678 阅读 · 0 评论 -
排序算法
排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。我们这里说说八大排序就是内部排序。 当n较大,则应采用时间复杂度为O(nlog2n)的排序方法:快速排序、堆排序或归并排序序。 快速排序:是目前基于比较的内部排序中被认为是最好的方法,当待排序转载 2016-09-27 10:38:52 · 194 阅读 · 0 评论 -
视觉直观感受 7 种常用的排序算法
1. 快速排序介绍:快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来,且在大部分真实世界的数据,可以决定设计的选择,减少所需时转载 2016-09-27 10:50:31 · 199 阅读 · 0 评论 -
最小生成树和图的遍历
Prim算法1.概览普里姆算法(Prim算法),图论中的一种算法,可在加权连通图里搜索最小生成树。意即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点(英语:Vertex (graph theory)),且其所有边的权值之和亦为最小。该算法于1930年由捷克数学家沃伊捷赫·亚尔尼克(英语:Vojtěch Jarník)发现;并在1957年由美国计算机科学家罗转载 2016-09-27 11:48:44 · 4090 阅读 · 0 评论 -
图的关键路径与拓扑排序
AOE网:在一个表示工程的带权有向图中,用顶点表示事件,用有向边表示活动,边上的权值表示活动的持续时间,称这样的有向图叫做边表示活动的网,简称AOE网。AOE网中没有入边的顶点称为始点(或源点),没有出边的顶点称为终点(或汇点)。AOE网的性质:⑴ 只有在某顶点所代表的事件发生后,从该顶点出发的各活动才能开始;⑵ 只有在进入某顶点的各活动都结束,该顶点所代表的事件才能发生。转载 2016-09-27 16:23:09 · 1839 阅读 · 0 评论 -
Hash查找算法
哈希查找,也称为散列查找(本文以哈希称呼)。提起哈希,我的第一印象就是C#中的Hashtable类,它是由一组key/value的键值对组成的集合,它就是应用了散列技术。那么,什么是哈希查找呢?在弄清楚什么是哈希查找之前,我们要弄清楚哈希技术,哈希技术是在记录的存储位置和记录的关键字之间建立一个确定的对应关系f,使得每个关键字key对应一个存储位置f(key)。查找时,根据这个确定的对应关转载 2016-09-28 20:46:09 · 14825 阅读 · 0 评论 -
教你从头到尾利用DL学梵高作画
教你从头到尾利用DL学梵高作画作者:七月在线开发/市场团队三人,骁哲、李伟、July。本教程主要由骁哲撰写,李伟负责Linux命令部分。配置:GTX 1070 cuda 8.0 Ubuntu 14.04 cudnn 5.1 tensorflow gpu时间:二零一六年九月二十五日一、前言12年本博客推出SVM三层境界,July开始学习接触ML。14年July转载 2016-10-04 10:50:20 · 4931 阅读 · 1 评论 -
基于层次的聚类----AGNES算法使用(R语言)
凝聚[plain] view plain copy # 产生数据集 xydata# 彩色空间 library(colorspace) # 显示数据集的结构 str(data) # 系统聚类 # 聚类的一些必要的函数 library(cluster) library(rattle)转载 2016-11-15 11:15:05 · 3940 阅读 · 0 评论 -
ARIMA时间序列
一:基础我们可以使用sacn()函数的”skip”参数指定文件中从顶部开始有多少行需要忽略。为了将数据读入到R,并且忽略掉文件中的前三行, 我们输入以下代码: kings <- scan(“D:\test\timeseries\king.txt”,skip=3) Read 42 items kings [1] 60 43 67 50 56 42 50 65 68 43 65原创 2017-04-10 20:38:17 · 2476 阅读 · 0 评论 -
GeoHash核心原理
引子机机是个好动又好学的孩子,平日里就喜欢拿着手机地图点点按按来查询一些好玩的东西。某一天机机到北海公园游玩,肚肚饿了,于是乎打开手机地图,搜索北海公园附近的餐馆,并选了其中一家用餐。饭饱之后机机开始反思了,地图后台如何根据自己所在位置查询来查询附近餐馆的呢?苦思冥想了半天,机机想出了个方法:计算所在位置P与北京所有餐馆的距离,然后返回距离机机的计算思想很朴素,就是转载 2016-09-26 16:46:22 · 306 阅读 · 0 评论 -
平衡二叉树
树旋转是在二叉树中的一种子树调整操作, 每一次旋转并不影响对该二叉树进行中序遍历的结果. 树旋转通常应用于需要调整树的局部平衡性的场合. 树旋转包括两个不同的方式, 分别是左旋转和右旋转. 两种旋转呈镜像, 而且互为逆操作. 平衡二叉树在进行插入操作的时候可能出现不平衡的情况,AVL树即是一种自平衡的二叉树,它通过旋转不平衡的节点来使二叉树重新保持平衡,并且查找、插入和删除转载 2016-09-26 11:15:15 · 330 阅读 · 0 评论 -
一种新型聚类算法(Clustering by fast search and find of density peaksd)
作者在这篇文章中介绍了一种新型的聚类算法 -- 基于密度的聚类算法。灵感来源经典的聚类算法K-means是通过指定聚类中心,再通过迭代的方式更新聚类中心的方式,由于每个点都被指派到距离最近的聚类中心,所以导致其不能检测非球面类别的数据分布。虽然有DBSCAN(density-based spatial clustering of applications with noise)对于转载 2016-07-13 09:44:31 · 1108 阅读 · 0 评论 -
R语言三种聚类
一、距离和相似系数二、层次聚类法三、动态聚类 kmeans四、DBSCAN一、距离和相似系数r语言中使用dist(x, method = "euclidean",diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离。method的取值有:euclidean原创 2016-09-11 11:17:42 · 4346 阅读 · 0 评论 -
WEKA内存不足的处理办法
WEKA内存不足的处理办法 用Weka有时候会因为内存不足而报错。它会提示你用命令行修改内存配置。可以直接修改安装目录下的配置。如果Weka版本较新,则打开WEKA目录下的Runweka.ini文件,找到这一行: maxheap=128m 修改128如果版本比较旧,安装目录下没有Runweka.ini,则打开Runweka.bat文件,找到 java -Xmx1原创 2016-09-11 11:20:26 · 2152 阅读 · 0 评论 -
R语言读取csv文件
加载相应的程序包,这些程序包里有R的内置函数,加载语法为: library(X) ; X表示程序包setwd("D://R_work//data") #设置工作区间data = read.table("XXX.csv",header=F, sep=",") #读取csv文件 data #输出向量data4中的内容原创 2016-09-11 14:31:30 · 38300 阅读 · 0 评论 -
扩大R控制台的显示行数及DBSCAN包
扩大R控制台的显示行数:ptions(max.print=1000000) R语言的DBSCAN包,找到了。http://rss.acs.unt.edu/Rdoc/library/fpc/html/dbscan.html需要安装fpc包install.packages(fpc)假设使用鸢尾花数据集iris.datads 感觉R半径和最原创 2016-09-11 14:32:55 · 1426 阅读 · 0 评论 -
R dbscan()中文说明
R dbscan()中文说明 dbscan(fpc)dbscan()所属R语言包:fpc DBSCAN density reachability and connectivity clustering DBSC转载 2016-09-11 14:34:27 · 2817 阅读 · 0 评论 -
R做时间序列(ARIMA)的案例
Arima预测模型(R语言) ARIMA(p,d,q)模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量转载 2016-09-11 14:36:19 · 24325 阅读 · 1 评论 -
聚类算法评价指标
一、Not Given Label:1、Compactness(紧密性)(CP) CP计算 每一个类 各点到聚类中心的平均距离 CP越低意味着类内聚类距离越近 缺点:没有考虑类间效果2、Separation(间隔性)(SP) SP计算 各聚类中心两两之间平均距离 SP原创 2016-09-10 17:28:31 · 76111 阅读 · 0 评论