一 First ,我们要知道大数据是什么?其次再深层发掘其潜在特征及作用。下面用一张图简单给大家介绍一下。
二 second 深层次给大家图解一下大数据的显著特征。
1️⃣Volume 大数据数据量大
2️⃣Variety 数据类型多
3️⃣Value 价值密度低
4️⃣Velocity 要求处理速度块
以及以下四个关键技术
▶️1 数据采集
▶️2 数据储存和管理
▶️3 数据处理与分析
▶️4 数据隐私与安全
三 third 就是大数据的三个主要层面
▶️第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
▶️第二层面是技术,技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
▶️第三层面是实践,实践是大数据的最终价值体现。在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据。
以下图示:大数据的三个层面
四 finally 也就是本章最重要的内容,大数据结构化数据与非结构化数据的区别分析与对比
▶️结构化数据:即固定格式和有限长度的数据。也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。
▶️非结构化数据:数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML, HTML、各类报表、图像和音频/视频信息等等。
*️⃣结构化数据与非结构化数据的区别 1、定义不同;
2、来源不同;
3、形式不同;
4、模型不同;
5、存储不同;
6、使用不同;
▶️以下用两张图充分显示
最后的最后再给大家补充一下半结构化数据
◀️半结构化数据▶️
半结构化数据举例
1️⃣XML文件:XML是一种标记语言,用于存储和传输数据。它可以描述复杂的数据结构和层次关系。例如,一个包含学生信息的XML文件可以包含学生姓名、年龄、性别等信息。
2️⃣JSON文件:JSON是一种轻量级的数据交换格式,常用于网页和移动应用程序中。它使用键值对的形式存储数据,可以表示复杂的数据结构。例如,一个包含商品信息的JSON文件可以包含商品名称、价格、库存等信息。
3️⃣日志文件:日志文件通常记录系统、应用程序或网络设备的操作和事件。它们可以包含时间戳、事件类型、源IP地址等信息。由于日志文件的格式和内容可能各不相同,因此它们通常被视为半结构化数据。
⏺️关于大数据技术,以及大数据结构化数据和非结构化数据的分析与对比就这些了!