期末救命-大数据技术原理及应用(林子雨版)(巧记知识点)

大数据
第一章
1、三次信息化浪潮
信息化浪潮 发生时间 标志 解决问题
第一次浪潮 1980年前后 个人计算机 信息处理
第二次浪潮 1995年前后 互联网 信息传输
第三次浪潮 2010年前后 物联网、云计算、大数据 信息爆炸

2、信息技术为大数据时代提供技术支撑(大数据到来的原因)?
1.存储设备容量不断增加,价格在不断下降
2.CPU处理能力大幅提升
3.网络带宽不断增加
3、数据产生方式的变革,是促成大数据时代来临的重要因素(数据产生方式经历的阶段)

运营式系统阶段 ——企业
用户原创内容阶段 ——用户本身
感知式系统阶段——物联网的发展,大量传感器
4、大数据发展历程
第一阶段:萌芽期,20世纪90年代至21世纪初
第二阶段:成熟期,21世纪前10年
第三阶段:大规模应用期,2010年以后
5、大数据的概念(4V) 进货的量大 泪就多,就算处理的速度快,价值也低
数据量大、数据类型繁多、处理速度快、价值密度低
数据量大 类型繁多
处理速快价值密度低
6、数据存储单位之间的换算关系(1 Byte=8 bit 、1 KB=1024 MB)
bit、Byte、KB、MB、GB、TB、PB(大数据)、EB、ZB
全球总共有35ZB数据
企业、银行数据属于系型数据,(官的)
视频、微信、手机呼叫信息等属于非结构化数据

7、大数据对科学研究的影响
第一范式:实验科学
第二范式:理论科学
第三范式:计算科学
第四范式:数据密集型科学

大数据影响,即为4范式
实验理论前两个 计算数据密集完

8、大数据对思维的认识

1 全样而非抽样
2. 效率而非精确
3. 相关而非因果

全样非抽样 效率非精确
相关非因果 思维对数据

大数据关键技术
数据采集与预处理
数据存储和管理
数据处理与分析
数据安全和隐私保护
9、大数据计算模式

批处理,流计算
查询分析图计算

批处理计算,MapReduce、Spark
流计算
图计算
查询分析计算,Hive

10、云计算
云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地的获得所需的各种IT资源
云计算服务模式
• IaaS,基础设施即服务
• PaaS,平台即服务
• SaaS,软件即服务
云计算包括公有云、私有云和混合云
11、关键技术
虚拟化
分布式存储
分布式计算
多租户

云计算 的概念
网络提供伸缩廉
分布式计算的能力
只需有网获资源
服务模式有3个
基础平软IPS
关键技术有4个
虚拟化 分布式
存储计算多租户
云算内容就背完

12、物联网
感知层、网络层、处理层、应用层(了解)
关键技术
识别和感知技术
网络与通信技术
数据挖掘与融合技术


物联网 万物联
关键技术就3点
识别感知网通信
数据挖掘融合完

13、大数据与云计算、物联网的关系

物联网是大数据的重要来源,大数据技术为物联网数据分析提供支撑
云计算为大数据提供了技术支持,大数据为云计算提供了用武之地
云计算为物联网提供了海量数据存储能力,物联网为云计算技术提供了广阔的应用空间

要谈三者的关系,那么就来谈一谈
雾是大树的来源,大树为物支撑点
云为大树供支持,大树让云有家园
云让雾联有能力,雾让白云有空间

第二章
1、Hadoop
Hadoop是Apache旗下的开源分布式计算平台
核心是分布式文件系统HDFS和MapReduce
HDFS是针对谷歌文件系统GFS的开源实现
MapReduce是针对谷歌MapReduce的开源实现

2、特性
高可靠性,高效性,高可扩展性,
高容错性 成本低,运行在Linux平台上,支持多种编程语言

还读谱 啊发奇
开源分布算平台
核心分布文件俩
H D F S第一个
迈普瑞丢死背完全
谈特性 有点乱
4点高高背一半
高可靠、高效性
高展高容成本贱
运行泪牛平台上
支持多种编程言

Hadoop的版本 最新3.x
2.x完全不同于1.0,全新的构架
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 38
    点赞
  • 301
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 大数据技术原理期末考试回答如下: 大数据技术原理是指通过对大规模的数据进行存储、处理和分析,获取有价值的信息和知识。这些技术主要包括数据收集、数据存储、数据处理、数据分析和应用等方面。 首先,数据收集是大数据技术中的第一步,它涉及到从各来源获取大规模的数据,包括传感器数据、网络数据、社交媒体数据等。数据收集可以通过爬虫、传感器、API等手段进行。 其次,数据存储是将收集到的大规模数据进行存储和管理,以便后续的数据处理和分析。常见的数据存储技术包括关系型数据库、分布式文件系统、NoSQL数据库等。 接下来,数据处理是对大规模的数据进行清洗、转换和集成的过程。数据清洗主要是去除数据中的冗余、重复和错误等问题,数据转换是将数据从一格式转换为另一格式,数据集成是将不同来源的数据进行整合。 数据分析是大数据技术的核心,它主要涉及到对大规模的数据进行统计、挖掘和模型建立等。数据统计可以通过各统计方法对数据的特征进行描述,数据挖掘是通过机器学习和数据挖掘算法对数据进行模式发现和知识获取,模型建立是根据数据分析结果构建预测模型和分类模型等。 最后,数据应用是将数据分析的结果应用到实际的业务场景中,以产生商业价值。数据应用可以通过数据可视化、智能推荐、风控等方式实现。 综上所述,大数据技术原理涵盖了数据收集、数据存储、数据处理、数据分析和数据应用等方面,通过对大规模的数据进行整合、分析和应用,可以为企业和个人提供更准确、更有效的决策支持和业务创新。 ### 回答2: 大数据技术原理期末考试答题中包含了以下内容: 1. 大数据的定义和特点:大数据指的是规模巨大、复杂多变的数据集合。其特点包括数据量大、数据多样化、数据处理速度快、数据价值高等。 2. 大数据技术的基本原理大数据技术主要基于分布式存储和计算原理。其中,分布式存储指的是将大数据集合分散存储于多个服务器上,以保证数据的安全性和可靠性;分布式计算则是将数据分布在多台计算机上进行并行处理,以提高数据处理的效率。 3. 大数据的处理流程:大数据处理主要包括数据收集、数据存储、数据处理和数据分析等步骤。首先,通过各方式收集大量的数据;然后,将数据存储于分布式文件系统或数据库中;接着,利用分布式计算框架进行数据处理,包括数据清洗、数据转换和数据集成等;最后,通过各数据分析方法和工具,提取有价值的信息和知识。 4. 大数据技术应用领域:大数据技术已经广泛应用于各个领域,如金融、医疗、电商、社交媒体等。在金融领域,大数据技术可以用于风险控制、欺诈检测等;在医疗领域,可以应用于疾病诊断、药物研发等;在电商领域,可以用于用户行为分析、推荐系统等;在社交媒体领域,可以用于情感分析、社交网络分析等。 5. 大数据技术面临的挑战:大数据技术面临着数据安全和隐私保护、数据质量问题、数据处理速度等挑战。如何保护大数据的安全性,保护用户的隐私,提高数据的质量,提高数据处理的速度等是大数据技术发展中亟待解决的问题。 通过以上内容的回答,可以完整地回答大数据技术原理期末考试答题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值