结构化数据、半结构化数据、非结构化数据

结构化数据,数据结构可以固定的数据。结构化数据特征之一就是,可以现有数据结构,再有数据。比如RDBMS的二维表中的数据就是结构化的数据,二维表的结构是固定的,在数据到来之前,字段类型和长度,字段个数以及顺序都是固定的,数据结构定义在数据制造出来之前。

非结构化数据,数据结构难以固定化的数据。比如图片、办公文档、视频数据等。

半结构化数据,可以结构化但无法结构固定的数据。以丰富变化的json格式数据为例,单个字段的类型可以是数字型也可以是字符型等,可以嵌套多层json的伸缩性,这些都造成数据结构无法固定化。所以拥有如上特性的json数据不是结构化数据,但是它也是有结构的。可以将它划归半结构化数据。

结构化数据与非结构化数据,同一种数据,在不同的业务角度下,这边可能作为结构化数据,那边可能作为非结构化数据。比如财务文档,如果需求仅仅是获取财务文档,那么文档本身可以作为最基本的信息项(如同RDBMS中表中的单个字段),这是多个文档组成的数据集合就是基于单个文档的结构化数据。换个角度,如果需求是统计文档中的收支情况,那么单个文档就对应多个基本信息项,这是文档集合就变成了非结构化数据。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值