结构化数据和非结构化数据的区别_结构化数据还是非结构化数据?

  结构化数据还是非结构化数据?

45bc04031de009ed8776b86696daffdd.png

结构化数据还是非结构化数据?

  目前国内20%的大数据是易于统计使用的结构化数据(存储在数据库里,可以用二维表结构来逻辑表达实现的数据,如数字、符号等),80%是非结构化数据(所有格式的文档、报表、图像和音频/视频信息等)。例如,工行数据仓库有360多TB的结构化数据,非结构化数据59个PB,后者是前者的200倍。

  由于非结构化数据处理起来难度较高,因此,多数公司基本上只分析结构化数据,而忽略了花重金保存下来的大多数非结构化数据。处理非结构化数据的基本思路就是“结构化”。以文档处理为例,系统可以在网上抓取、分析消费者的评论(正面的、负面的),甚至对用户行为做出预测。在图像识别方面,“谷歌大脑”经过充分的自学习,能够记忆并识别特定的概念。比如,给“谷歌大脑”看10000张关于“猫”的图片,它就能判断并记住猫的特征,可以辨别出猫。类似的图像识别技术也可以用在卫星图像识别上。其他还有音频、视频等,大数据时代不只是数字化,更需要结构化。

  对于已经具备大数据部署能力的企业,未来可以采集、读取、录入社交媒体数据、网络日志、语音视频数据等非结构化数据,通过结构化使之可用,并实现数据的实时性,在此基础上与自己的用户建立互动联系,用“活”大数据,更好地挖掘大数据的价值。

f81a6049f47a1a589abb725a1ab7b1be.png

结构化数据还是非结构化数据?

表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
©️2020 CSDN 皮肤主题: 游动-白 设计师:白松林 返回首页