bluenight专栏

宁静致远

A Tutorial on Clustering Algorithms-聚类小知识

俗话说:“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。所谓类,通俗地说,就是指相似元素的集合。聚类分析又称群分析,它是研 究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现...

2010-05-17 13:01:00

阅读数:2706

评论数:0

数据挖掘领域的主要会议

 数据挖掘领域的主要会议 【转载】 ...

2010-05-03 22:07:00

阅读数:2049

评论数:0

Social network & Social computing(社会网络和社会计算)

社会计算,英文为Social Computing,中文也译为社会性计算、社交计算、社交性计算等。 什么是社会计算?目前对 此还没有一个明确和公...

2010-04-03 13:42:00

阅读数:3787

评论数:0

流行的开源数据挖掘tool

IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集。 ...

2010-01-20 18:27:00

阅读数:2594

评论数:0

灰系统和模糊数学

灰系统和模糊数学 ...

2009-12-05 17:18:00

阅读数:1617

评论数:1

数据集-用于数据挖掘、信息检索、知识发现等

1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b 2、几个实用的测试数据集下载的网站 http://www.cs.toronto.edu/~roweis/data.html http://www.cs.toronto.edu/~roweis/data...

2009-11-22 13:09:00

阅读数:5079

评论数:3

洗衣机,数据挖掘的物理模型

洗衣机,数据挖掘的物理模型 昨天整洗衣机。看着大大小小新新旧旧,机身多赫然印一大字: Fuzzy Fuzzy Logic,模糊逻辑控制, 大概说"只需按下启动键,从选择程序到漂洗、脱水,实现了全自动的控制。这种模糊逻辑控制的洗衣机可以自动检测洗衣内的衣物重量,从而自动选择水位...

2009-11-10 20:28:00

阅读数:2341

评论数:0

数据挖掘——我们能从股市数据得出什么,以及一些算法

数据挖掘——我们能从股市数据得出什么,以及一些算法 //一个备忘录了,写给我们金融信息系统项目小组的同学。没有列出参考文献,因为都是大白话。有些删节。 数据挖掘/机器学习大概处理以下几个问题: 分类 ,这是有很多非常成熟的算法,非常直观,按照一个分类属性,把样本分为不同的类别。 ...

2009-11-10 19:20:00

阅读数:3288

评论数:0

数据采集策略:数据挖掘与统计学的一个区别

数据采集策略:数据挖掘与统计学的一个区别 这个观点来自Hand等人的《数据挖掘原理》(机工,2003)。 说数据挖掘是对已经存在的数据进行分析(比如说“[原有]数据库中的知识发现”,KDD),而统计会为了回答某一个特定问题而专门去采集数据。也就是说,数据挖掘所分析处理的数据,不是为挖掘本身而收...

2009-11-10 19:04:00

阅读数:2531

评论数:0

Weka数据挖掘

1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。 ...

2009-11-03 20:34:00

阅读数:8706

评论数:3

weka决策树实验

首先举出打网球的例子。 数据集中包含14个样本,其中9个正样本(yes),5个负样本(no)。则这些元组的期望信息(即熵)为: Info(D) = - 9/14 * log2(9/14) - 5/14 * log2(5/14) = 0.940 现在观察每个属性的期望信息需求。在属性Ou...

2009-11-03 18:15:00

阅读数:10991

评论数:1

  复杂网络社区结构划分方法

   复杂网络社区结构划分方法 随着对网络性质的物理意义和数学特性的深入研究,人们发现许多实际网络都具有一个共同性质,即社区结构。也就是说,整个网络是由若干个“社区”或“组”构成的。每个社区内部的结点间的连接相对非常紧密,但是各个社区之间的连接相对来说却比较稀疏[1][2]。揭示网络的社区结构,对...

2009-11-02 17:46:00

阅读数:5038

评论数:0

核聚类与支持向量聚类

  核聚类与支持向量聚类   聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术[1]。作为一种常见的数据分析工具和无监督机器学习方法,聚类的目的是把数据集合分成若干类(或簇),使得每个类中的数据之间最大限度地相似,而不同类中的数据最大程度地不同。根据聚类算法所采用的基本思想,大致可以将它们...

2009-11-02 17:30:00

阅读数:7464

评论数:2

聚类分析(Clustering Analysis)

聚类分析(Clustering Analysis)   聚类作为数据挖掘与统计分析的一个重要的研究领域,近年来倍受关注。从机器学习的角度看,聚类是一种无监督的机器学习方法,即事先对数据集的分布没有任何的了解,它是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程。聚类方法作为一类非常重要的...

2009-11-02 17:03:00

阅读数:5528

评论数:0

数据挖掘与数据抽样 

    前段时间在做一个挖掘模型时,模型的特征决定了选择的数据是严重有偏的,怎样在这样的数据上进行抽样,得到能比较好地反映真实情况的数据样本是很关键的。自己对统计学仅仅限于大学课程的学习,很少做过实验,在做数据预处理走了一些弯路。下面对数据挖掘中的抽样发表一点浅见。谢谢苦瓜兄弟解答,希望和大家多多...

2009-09-26 17:25:00

阅读数:3097

评论数:1

十大数据挖掘算法

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, ...

2009-07-28 11:09:00

阅读数:3772

评论数:0

数据预处理

现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提前数据挖掘的质量产生了数据预处理技术。  数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等。这些数据处理技术在数据挖掘之前使用,大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间。  ...

2009-03-23 20:37:00

阅读数:2064

评论数:0

关于svm

名词解释:(1) SVM(Support Vector Machine)是从瓦普尼克(Vapnik)的统计学习理论发展而来的,主要针对小样本数据进行学习、分类和预测(有时也叫回归)的一种方法,能解决神经网络不能解决的过学习问题。作者以为,类似的根据样本进行学习的方法还有基于案例的推理(Case-B...

2009-02-21 19:17:00

阅读数:4102

评论数:2

关于时空挖掘方面的期刊和会议

Journals:· ACM Transactions on Database Systems· VLDB Journal· IEEE Transactions on Knowledge and Data Engineering· Information Systems· Data and Kno...

2009-02-09 11:27:00

阅读数:899

评论数:0

Google视角的地理信息科学家

Google Scholar可以查询一些学者的发表和引用情况,它是基于检索的,相对于SCI,可能不那么严格,但是因为SCI只包括论文,不包括书,另外,查询引文的范围也有限,这使得不能全面反映一个学者的贡献。所以相对而言,Google Scholar尽管不太成熟,但是方向是好的。 近来查询了几位地理...

2009-01-23 12:36:00

阅读数:1095

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭