Matlab实现模糊聚类之IsoData算法111

第一部分是本科时候学数据挖掘时积累的。

一.数据挖掘基础

1.数据挖掘三个研究方向:统计学、数据库和机器学习。
2.数据库系统和文件系统区别:都有存储,但前者查询处理和事务处理(原子性)以及并发控制;在磁带盘上的话只能顺序访问。
3.并不是所有的东西都是数据挖掘,比如查询处理,专家系统、统计程序或者小型的数学计算。
4.数据挖掘其实应该叫知识挖掘。
5.空间数据库:GIS,遥感,医学影像,里面存储的是一些矢量。
6.流数据:连续的有序的变化的快速的,主要应用于网络监控,股票市场,流媒体等,在线看视频后并没有在本地保存,不是以文件形式存在的。

7.风险预测;广告投放。

操作性数据库的数据往往都归档了,已经存储在磁盘。

并发控制主要是对写操作进行的,数据仓库不需要写操作,所以不需要事务处理、恢复和并发控制等机制。

二.isodata算法原理

 

 

 

参考:http://blog.csdn.net/houston11235/article/details/8511379

http://blog.sina.com.cn/s/blog_4fb4d8d40100nrcq.html

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值