nlp学习记录【结构化数据是什么?】

本文介绍了非结构化数据的概念,与结构化数据相对,非结构化数据包括文本、图片等。数据结构是数据元素间关系的集合,通过结构化数据可以方便管理和调用。NLP作为处理非结构化数据的工具,其核心是寻找和理解数据之间的关系。
摘要由CSDN通过智能技术生成

很多书籍都将nlp定义为处理非结构化数据的重要工具。

这短短一句话交代了nlp的主要意义,处理非结构化数据。

那么,什么是非结构化数据呢?

在百度中,我们很容易找到介绍:

  相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

  非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息)。

  非结构化WEB数据库主要是针对非结构化数据而产生的,与以往流行的关系数据库相比,其最大区别在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构化信息(包括各种多媒体信息)中有着传统关系型数据库所无法比拟的优势。

但是我们很难理解这段话的意义,我们得深度研究一下,这对于我们的基础掌握是很有意义的。

所以,我们得先将这个问题全面化一下,何为数据结构,因为不论是非结构化数据,还是结构化数据,他都是基于数据结构这个概念成立的。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值