![6770c82bce64d76f7b8258cad1884ddd.png](https://img-blog.csdnimg.cn/img_convert/6770c82bce64d76f7b8258cad1884ddd.png)
大数据分析和应用得到了各个行业的关注,人们试图从大量数据中发现蕴含的模式和规律,进而产生更多的价值,“数据”作为分析对象在这个过程中所起到的作用是决定性的。本文对结构化数据、非结构化数据、数据结构、关系型数据库、实体关系图、数据模型等我们熟悉的概念进行剖析,说明它们之间的联系和区别。指出非结构化数据处理是大数据分析技术的难点和重点,是提升大数据价值挖掘深度的宝剑,在大数据的教学、研究、学习和应用开发中,围绕非结构化数据处理应当成为核心和重点。
数据这个概念对于每个人来说,是再熟悉不过的,我们生活在数据的世界里,在将来智能发达的时代里更是一刻也离不开数据。然而在千变万化的各种数据中,是否存在一些稳定不变的本质? 在变化中寻找不变是科学探索的一条重要思维原则。
各种形式的数据可以归结为结构化数据、半结构化数据和非结构化数据三大种类。它们的区别在于数据的表示是否存在预先定义好的数据模型,因此什么是数据模型是深入理解大数据的关键。数据模型是一种抽象模型,用于表达数据含义的构成单元及其它们之间相互关系、数据与现实世界之间的对应关系。
数据模型包括三种相对独立的层次上的模型。
一是物理数据模型,表示了数据在计算机中存储的物理结构,通常是数据库中的分区、表空间、段、文件等。
二是逻辑数据模型,表示了数据在计算机中进行计算处理的逻辑结构,通常是数据表、列、对象、符号、树等。通常所说的数据结构是在计算机中高效存取和运算数据的一种表示方法,