数据仓库-笔记

数据仓库的特点:

  1. 面向主题
  2. 集成
  3. 相对稳定
  4. 反映历史变化

ETL抽取过程:

  1. 抽取
  2. 转换
  3. 加载

建立数据仓库的步骤:

  1. 收集和分析业务需求
  2. 建立数据模型和数据仓库的物理设计
  3. 定义数据源
  4. 选择数据仓库技术和平台
  5. 从操作型数据库中抽取,清洗及转换数据到数据仓库
  6. 选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件
  7. 更新数据仓库

自动摘要:

  1. 主题摘要
  2. 信息摘要
  3. 纲目摘要
  4. 摘录型摘要
  5. 评论型摘要

WEB挖掘

  • WEB内容挖掘
    • 文本挖掘
    • 多媒体挖掘
  • WEB结构挖掘
    • 超链接挖掘
    • 页面结构挖掘
  • WEB使用挖掘
    • 用户访问模式挖掘
    • 分析定制WEB站点

神经网络

  1. 计算总体误差对于每个参数的有序倒数公式(函数)
  2. 任意选择一组数据作为初始参数
  3. 根据当前参数计算总体误差
  4. 计算各参数的增量,并计算调整后的参数大小,把调整后的参数作为当前参数

ID3:

信息增益的缺点是倾向于取值较多的属性
只能对描述属性为离散型属性的数据集构造决策树

支持度≥SUP(min)的项集称为频繁项集。

如果L2 = { {A,B},{A,C},{B,C},{B,D},{A,D} };
则连接产生的C3 = abc ,adb,acd ,bcd //子集没有cd,去掉CD
修剪C3 = ABC ABD

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值