软考高级第四版备考---第四十五天(数据工程--数据开发利用)

一、数据集成:数据集成就是将驻留在不同数据源中的数据进行融合,向用户提供统一的数据视图(一般称为全局模式),使得用户能以透明的方式访问数据

二、数据挖掘

2.1定义:数据挖掘是指从大量数据中提取或“挖掘”知识,即从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、却是潜在有用的知识

2.2数据挖掘与传统数据分析不同:

  • 两者分析对象的数据量有差异,数据挖掘数据量更大,数据量越大,数据挖掘的效果越好;
  • 两者运用的分析手法有差异:运用统计学的方法、手段对数据进行分析;运用数据统计、人工智能、可视化等技术
  • 两者分析侧重有差异:回顾型和验证型、预测型和发现型
  • 两者成熟度不同

2.3目标:发现隐藏于数据之后的规律和数据间的关系,从而服务于决策

2.4主要任务:主要任务包括数据总结、关联分析、分类和预测、聚类分析和孤立点分析

2.5流程:确定分析对象、数据准备、数据挖掘、结果评价、结果应用

三、数据服务:数据服务主要包括数据目录服务、数据查询与浏览及下载服务、数据分发服务

四、数据可视化

一维数据:一维数据就是简单的线性数据,如文本或数字表格、程序源代码都基于一维数据

二维数据:最常见的二维数据可视化就是地理信息系统(GIS)

三维数据:物体通过三维可视化构成计算机模型,供操作及试验,以及预测真实物体的实际行动

多维数据:在可视化环境中,多维数据所描述事物的属性超过三维,为实现可视化,往往需要降维

时态数据可视化:以图形方式显示随着时间变化的数据,是可视化信息最常见、最有用的方式之一

层次数据可视化:层次数据即树形数据,其数据内在结构特征为:每个节点都有一个父节点(根节点除外)

网络数据可视化:网络数据指与任意数据的其他节点有关系的节点数据

五、数据检索:

主要方法:

  • 全文检索;
  • 字段检索
  • 基于内容的多媒体检索
  • 数据挖掘

常用技术:

  • 布尔逻辑检索技术
  • 截词检索技术
  • 临近检索技术
  • 限定字段检索技术
  • 限制检索技术
  • 14
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值