我所理解工作中真实的数据处理流程

大数据处理涉及数据收集、预处理、存储、分析、展示和应用等多个环节。数据预处理包括数据清洗、集成、变换和规约;数据分析根据业务需求选择合适的技术;数据展示则通过可视化手段呈现结果,最终数据应用到实际决策中。
摘要由CSDN通过智能技术生成

大数据处理流程主要包括:

数据收集 --> 数据预处理 --> 数据存储 --> 数据分析 --> 数据展示/数据可视化 --> 数据应用

-- 数据收集:根据业务需求收集业务场景所需数据

-- 数据预处理:

①数据清洗---去掉噪声和无关数据(异常值、缺失值、重复值、数据过滤与纠正)

②数据集成--将多个数据源的数据结合起来存放在一个一致的数据存储中。

③数据变换--把原始数据转换为适合数据挖掘的形式。

④数据规约--主要方法为数据立方体聚焦、维度规约、数据压缩、数值规约、离散化和概念分层

-- 数据存储:存储在数据库或者HDFS上

-- 数据分析

应根据大数据应用情境与决策需求,选择合适的数据分析技术(比如关联分析,聚类分析,深度学习,提高大数据分析结果的可用性、价值性和准确性质量。

-- 数据展示和数据可视化

数据可视化是指将大数据分析与预测结果以计算机图形或图像的直观方式显示给用户的过程,并可与用户进行交互式处理。

-- 数据应用

大数据应用是指将经过分析处理后挖掘得到的大数据结果应用于管理决策、战略规划等的过程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值