作业3 | 结构化数据、非结构化数据、半结构化数据

一、结构化数据

结构化数据是指具有一定结构性、可以划分为固定的基本组成要素、能通过一个或多个二维表来表示的数据。
一般存储在关系数据库中,具有一定逻辑结构,可用关系数据库的表或视图表示,一般使用关系型数据库来管理结构化数据,极大地方便了人们的日常生活和工作。
例如:传统的关系数据模型、行数据等。

二、非结构化数据

非结构化数据是指结构化数据以外的数据,数据结构不固定,无法使用关系数据库存储,只能够以各种类型的文件形式存放。
非结构化数据通常无法直接知道其内容,必须通过对应的软件才能打开浏览。数据库也只能将它保存在一个BLOB字段中,对以后的数据检索造成了极大的麻烦。而且该数据不易理解,无法从数据本身直接获取其表达的意思。非结构化数据没有规定的结构,不能将其标准化,不易于管理,所以查询、存储、更新以及使用需要更智能化的系统。
例如:各种文档、图片、音频、视频等。

三、半结构化数据

半结构化数据是介于结构化数据和非结构化数据之间的一种数据形式,是具有结构的数据,但是结构变化很大,因此该数据不能简单地组织成一个文件按照非结构化数据处理,也不能简单地建立一个表与它对应。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分
例如:XML、HTML等。

参考:万里鹏. 非结构化到结构化数据转换的研究与实现[D].西南交通大学,2013.
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值