大数据技术原理——期末复习图计算

1、什么是BSP计算模型?

“大同步”模型

答:超步是一种并行计算模型

2、试述BSP模型中超步的3个组件及具体含义

答:局部计算:每个参与的处理器都有自身的计算任务,它们只读取存储在本地内存中的值,不同处理器的计算任务都是异步并且独立的。

:处理器群相互交换数据,交换的形式是,由一方发起推送(Put)和获取(Get)操作

栅栏同步:当一个处理器遇到“路障”(或栅栏),会等其他所有处理器完成它们的计算步骤;每一次同步也是一个超步的完成和下一个超步的开始。

  1. 最短路径问题是图论中最有名的问题之一,其中s-t最短路径在现实生活中应用最广泛,比如寻找驾驶路线等。请给出Pregel计算过程。

•Pregel的计算过程是由一系列被称为“超步”

的迭代组成的

•在每个超步中,每个顶点上面都会并行执行

用户自定义的函数,该函数描述了一个顶点V

在一个超步S中需要执行的操作

•该函数可以读取前一个超步(S-1)中其他顶点

发送给顶点V的消息,执行相应计算后,修改

顶点V及其出射边的状态,然后沿着顶点V的

出射边发送消息给其他顶点,而且,一个消

息可能经过多条边的传递后被发送到任意已

知ID的目标顶点上去

•这些消息将会在下一个超步(S+1)中被目标顶

点接收,然后象上述过程一样开始下一个超

步(S+1)的迭代过程

•在Pregel计算过程中,一个算法什么时候可以结束,是由所有顶点的状态

决定的

•在第0个超步,所有顶点处于活跃状态,都会参与该超步的计算过程

•当一个顶点不需要继续执行进一步的计算时,就会把自己的状态设置为

“停机”,进入非活跃状态

•一旦一个顶点进入非活跃状态,后续超步中就不会再在该顶点上执行计算,

除非其他顶点给该顶点发送消息把它再次激活

•当一个处于非活跃状态的顶点收到来自其他顶点的消息时,Pregel计算框

架必须根据条件判断来决定是否将其显式唤醒进入活跃状态

•当图中所有的顶点都已经标识其自身达到“非活跃(inactive)”状态,并

且没有消息在传送的时候,算法就可以停止运行

 

BSP计算模型、Pregel计算流程

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 大数据技术原理期末考试回答如下: 大数据技术原理是指通过对大规模的数据进行存储、处理和分析,获取有价值的信息和知识。这些技术主要包括数据收集、数据存储、数据处理、数据分析和应用等方面。 首先,数据收集是大数据技术中的第一步,它涉及到从各种来源获取大规模的数据,包括传感器数据、网络数据、社交媒体数据等。数据收集可以通过爬虫、传感器、API等手段进行。 其次,数据存储是将收集到的大规模数据进行存储和管理,以便后续的数据处理和分析。常见的数据存储技术包括关系型数据库、分布式文件系统、NoSQL数据库等。 接下来,数据处理是对大规模的数据进行清洗、转换和集成的过程。数据清洗主要是去除数据中的冗余、重复和错误等问题,数据转换是将数据从一种格式转换为另一种格式,数据集成是将不同来源的数据进行整合。 数据分析是大数据技术的核心,它主要涉及到对大规模的数据进行统计、挖掘和模型建立等。数据统计可以通过各种统计方法对数据的特征进行描述,数据挖掘是通过机器学习和数据挖掘算法对数据进行模式发现和知识获取,模型建立是根据数据分析结果构建预测模型和分类模型等。 最后,数据应用是将数据分析的结果应用到实际的业务场景中,以产生商业价值。数据应用可以通过数据可视化、智能推荐、风控等方式实现。 综上所述,大数据技术原理涵盖了数据收集、数据存储、数据处理、数据分析和数据应用等方面,通过对大规模的数据进行整合、分析和应用,可以为企业和个人提供更准确、更有效的决策支持和业务创新。 ### 回答2: 大数据技术原理期末考试答题中包含了以下内容: 1. 大数据的定义和特点:大数据指的是规模巨大、复杂多变的数据集合。其特点包括数据量大、数据多样化、数据处理速度快、数据价值高等。 2. 大数据技术的基本原理:大数据技术主要基于分布式存储和计算原理。其中,分布式存储指的是将大数据集合分散存储于多个服务器上,以保证数据的安全性和可靠性;分布式计算则是将数据分布在多台计算机上进行并行处理,以提高数据处理的效率。 3. 大数据的处理流程:大数据处理主要包括数据收集、数据存储、数据处理和数据分析等步骤。首先,通过各种方式收集大量的数据;然后,将数据存储于分布式文件系统或数据库中;接着,利用分布式计算框架进行数据处理,包括数据清洗、数据转换和数据集成等;最后,通过各种数据分析方法和工具,提取有价值的信息和知识。 4. 大数据技术的应用领域:大数据技术已经广泛应用于各个领域,如金融、医疗、电商、社交媒体等。在金融领域,大数据技术可以用于风险控制、欺诈检测等;在医疗领域,可以应用于疾病诊断、药物研发等;在电商领域,可以用于用户行为分析、推荐系统等;在社交媒体领域,可以用于情感分析、社交网络分析等。 5. 大数据技术面临的挑战:大数据技术面临着数据安全和隐私保护、数据质量问题、数据处理速度等挑战。如何保护大数据的安全性,保护用户的隐私,提高数据的质量,提高数据处理的速度等是大数据技术发展中亟待解决的问题。 通过以上内容的回答,可以完整地回答大数据技术原理期末考试答题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小步调LLY

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值