关于大数据的概述

开源大数据技术基础

引言

我认为分享知识是一件幸福的事情。

大数据概念

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程

大数据发展史

时间阶段
1887-2008大数据出现
2009-2012大数据热门
2013大数据元年
2017-2022大数据爆发

大数据特征

  • Volume
  • Variety
  • Value
  • Velocity

大数据结构

项目描述
结构化数据关系模型数据
半结构化数据非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、Email等
非结构化数据没有固定模式的数据,如WORD、PDF、PPT、EXL,各种格式的图片、视频等

大数据处理流程

  1. 数据挖掘
  2. 数据清洗
  3. 数据分析
  4. 数据可视化
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值