数据挖掘

数据挖掘


数据挖掘理论

数据挖掘概述

    数据挖掘是指从大量的数据中提取有用的信息和知识的过程。
1 数据挖掘对象
    数据挖掘可以针对任何类型的数据源。
1)关系数据库,利用关联分析等技术
2)数据仓库,数据仓库中的数据在进入仓库之前,经过了加工和集成,为数据挖掘所需要的高质量数据提供了保证
3)文本:特征提取,分类,聚类,文本摘要
4)多媒体数据:特征提取,基于内容的相似检索,
5)空间数据:空间关联分析,聚类,分类,空间趋势分析,光栅数据库挖掘
6)时序数据:趋势分析,序列模式挖掘等
7)Web数据:内容挖掘,结构挖掘,日志挖掘

XML数据挖掘

XML聚类
增强网络中XML文档的组织性,为检索提供良好技术支持


基于划分的聚类算法
首先随机的指定k个对象,每个对象代表一个簇的初始均值或者中心点,每个对象计算与k个簇均值或中心点相似度,并将其指派到最相似的簇中,然后更新簇的均值或者中心点,如此循环往复,直至均值或者中心点不再变化为止。

 

Oracle数据挖掘
1
    Oracle数据挖掘,Oracle Data Mining,ODM。
    ODM是Oracle数据库企业版的一个选件。可以通过Java和PL/SQL应用程序编程接口和Oracle Data Miner图形用户界面访问。
    CRISP-DM是事实上的数据挖掘行业标准和重要的数据挖掘过程模型,Oracle数据挖掘支持这一数据挖掘的跨行业标准流程。

    监督式学习需要数据分析人员确定一个目标属性和相关变量。
    在无监督式学习中,用户不为数据挖掘算法指定目标属性。

    Oracle数据挖掘提供两个聚类算法:增强的K-Means和正交分区聚类(O-Cluster)。

2
    启动Oracle Data Miner:双击<your_path>\bin\odminerw.exe。
    DBMS_DATA_MINING程序包包含若干过程,包括CREATE_MODEL和APPLY。CREATE_MODEL过程根据设置表(作为过程的参数之一提供)中的值为给定挖掘函数和数据集创建挖掘模型。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值