常用的大数据分析模型有哪些？

最新推荐文章于 2024-06-25 21:05:41 发布

cuanzhapan8891

最新推荐文章于 2024-06-25 21:05:41 发布

阅读量3.1k

点赞数 1

文章标签：大数据区块链

本文介绍了大数据的概念、特征和处理流程，重点讲解了八大常用的数据分析模型：行为事件分析、漏斗分析模型、留存分析模型、分布分析模型、点击分析模型、用户行为路径分析模型、用户分群分析模型和属性分析模型，帮助理解大数据在实际工作中的应用。

摘要由CSDN通过智能技术生成

　　现如今会上如果不说两句大数据、云计算、区块链、边缘计算等名词，就感觉被时代抛弃一样。那今天我们主要为大家讲解下什么是大数据；在做大数据可视化时，有哪些常见得到数据分析模型。

　　那么什么是大数据呢？

　　大数据（Big Data）概念是1998年由SGI首席科学家John Masey在USENIX大会上提出的。他当时发表了一篇名为Big Data and the Next Wave of Infrastress的论文，使用了大数据来描述数据爆炸的现象。但大数据真正得到业界关注，则是其后多年的事情了。其中大数据最重要的发酵素则是2003-2006年Google发布的GFS、MapReduce和BigTable三篇论文。

　　大数据是指海量数据或巨量数据，其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策。

　　大数据有哪些特征呢？

　　大数据的5V特征，即Variety(多样化)、Volume(大量化)、Velocity（快速化）、Value(价值密度低)、Veracity（真实性）。其中，Variety表示来源多和格式多，数据可以来源于搜索引擎、社交网络、通话记录、传感器等等，这些数据要么以结构化形式存储，要么以非结构化数据存储；Volume表示数据量比较大，从TB级别，跃升到PB级别。尤其是在移动互联时代，视频、语言等非结构化数据快速增长；Velocity表示数据存在时效性，需要快速处理，并得到结果出来，这一点也是和传统的数据挖掘技术有着本质的区别；Value表示大量不相关信息，不经过处理则价值较低，属于价值密度低的数据。Veracity（真实性）数据质量因数据来源以及记录方式等影响因素的不同，会出现较大的差异，而这种差异性会极大程度地影响数据分析的精确性

　　大数据处理流程是怎么样的呢？