大数据的导论

一 什么是大数据

前言:在学习大数据之前,要了解一下大数据是什么?用来干什么的?为什么使用大数据?

1.大数据概念

(1)大数据概念: bigdata,无法用常规软件处理的数据集合,这就需要一种新的模式去处理,这就是大数据

(2)大数据解决的问题: 海量数据的存储  海量数据的计算  海量数据的迁移 

(3)大数据应用场景: 为生活赋能/大数据人工智能时代/数字化时代

2.大数据特点

(1)大: 体积大
(2)多: 数据种类和来源多
(3)值: 低价值密度
(4)快: 增长速度快,处理速度快,获取速度快
(5)信: 结果准确,可以信赖的

3.大数据分析步骤

        (1)明确分析的目的和思路: 把分析目的分解成若干个不同的分析要点,确保分析框架的体系化和逻辑性
        (2)数据收集:一般数据来源为数据库、第三方数据统计工具、专业的调研机构的统计年鉴或报告、市场调查
        (3)数据处理:(E抽取T转换L加载)数据处理主要包括数据清洗、数据转化、数据提取、数据计算等,将原始数据加工成为分析需要的直观数据
        (4)数据分析:数据分析是指用适当的分析方法及工具,分析处理过的数据,提取有价值的信息的过程
        (5)数据可视化: 一般能用图说明问题的就不用表格,能用表格说明问题的就不要用文字。
        (6)撰写报告: 数据分析报告其实是对整个数据分析过程的一个总结与呈现。用于决策者参考做出决策

二 计算机组成

1. 计算机组成: 硬件和软件

2. 硬件:  冯诺依曼体系结构(输入设备,输出设备,运算器,控制器,内外存储器)

3. 软件:  系统软件和应用软件

4. 系统软件作用: 承上启下: 硬件和应用软件的桥梁

三 编程语言

1.编程语言: 人和计算机交互一种语言

2.编程语言历史: 低级语言 -> 高级语言 -> 面向对象时代(java和python)

注意: sql是一种特殊的编程语言

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值