数据挖掘
Mrchesian
发呆我可以发很久
展开
-
Python机器学习库
Python机器学习库摘要: Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array; 比较成熟的(广播)函数库; 用于整合C/C++和Fortran代码的工具包; 实用的线性代数、傅里叶变换和随机数生成函... Python在科学计算领域,有两个重要的原创 2016-07-18 23:33:18 · 929 阅读 · 0 评论 -
机器学习常用算法(一)R树的原理
R树是树的数据结构用于空间的访问方法,即索引多维信息等地理坐标,矩形或多边形。R树是由安东宁Guttman提出的在1984[ 1 ]已发现在理论和应用的环境中大量使用。[ 2 ]一个树常见的实际使用情况可能是存储空间的物体如餐馆的位置,或者说典型的地图是由多边形:街道,建筑,湖泊,海岸线的轮廓,并找到答案,快速查询如“找到所有的博物馆在我的当前位置”2公里,“在我的2公里位置检索所原创 2016-07-19 15:28:23 · 5124 阅读 · 0 评论 -
聚类算法
一、串行聚类算法1.1 划分方法(partitioning method)划分方法首先根据给定要构建划分的数目k创建一个初始划分,然后采用一种迭代的重定位技术,尝试通过对象在划分间移动来改进划分。一个好的划分的一般准则是:在同一类中的对象之间尽可能“接近”或相关,而不同类中的对象之间尽可能“远离”或不同。为了达到全局最优,基于划分的聚类会要求穷举所有可能的划分。实际上,绝大多数应用原创 2016-08-04 18:50:00 · 15663 阅读 · 0 评论 -
python 实现 AP近邻传播聚类算法(Affinity Propagation)
Affinity Propagation (AP) 聚类是2007年在Science杂志上提出的一种新的聚类算法。它根据N个数据点之间的相似度进行聚类,这些相似度可以是对称的,即两个数据点互相之间的相似度一样(如欧氏距离);也可以是不对称的,即两个数据点互相之间的相似度不等。这些相似度组成N×N的相似度矩阵S(其中N为有N个数据点)。AP算法不需要事先指定聚类数目,相反它将所有的数据点都作原创 2016-08-28 13:28:57 · 11849 阅读 · 2 评论 -
R-树相关技术
空间索引是对存储在介质上的数据位置信息的描述,用来提高系统对数据获取的效率。GIS涉及的各种海量复杂数据存储于外存,如果对磁盘上的数据的位置不加以记录和组织,每查询一个数据项都要扫描整个数据文件,则这种访问磁盘的代价将严重影响系统的效率。因此索引的建立与处理至关重要。此外GIS所表现的地理数据多维性使得传统的B树索引不再适合,因为B树所针对的字符、数字等传统数据类型是在一个良序集之中,即都是在一个原创 2016-08-07 10:45:23 · 2694 阅读 · 0 评论 -
计算机视觉、模式识别、机器学习相关方向资源
牛人主页(主页有很多论文代码)Serge Belongie at UC San DiegoAntonio Torralba at MITAlexei Ffros at CMUCe Liu at Microsoft Research New EnglandVittorio Ferrari at Univ.of EdinburghKristen Grauman at UT AustinDevi原创 2016-08-23 21:42:58 · 3251 阅读 · 0 评论 -
python 实现识别手写 MNIST数字集的程序
python 实现识别手写 MNIST 数字集的程序我们需要做的第⼀件事情是获取 MNIST 数据。如果你是⼀个 git ⽤⼾,那么你能够通过克隆这本书的代码仓库获得数据, 实现我们的⽹络来分类数字git clone https://github.com/mnielsen/neural-networks-and-deep-learning.gitclass Network(object):def __init__(self, si原创 2016-07-14 21:53:04 · 24550 阅读 · 5 评论 -
python 实现 knn分类算法 (Iris 数据集)
1、KNN分类算法KNN分类算法(K-Nearest-Neighbors Classification),又叫K近邻算法,是一个概念极其简单,而分类效果又很优秀的分类算法。他的核心思想就是,要确定测试样本属于哪一类,就寻找所有训练样本中与该测试样本“距离”最近的前K个样本,然后看这K个样本大部分属于哪一类,那么就认为这个测试样本也属于哪一类。简单的说就是让最相似的K个样本来投票决定。KNN算法不仅...原创 2016-07-17 00:54:29 · 26949 阅读 · 20 评论 -
数据挖掘类的国际顶尖会议
原创 2017-09-28 22:11:29 · 2780 阅读 · 0 评论