- 博客(11)
- 资源 (2)
- 收藏
- 关注
原创 云计算与云存储 期末复习
一个分区内的数据的执行是有序的。当 spark 程序中,存在过多的小任务的时候,可以通过 coalesce 方法,收缩合并分区,减少分区的个数,减小任务调度成本。在类型为(K,V)和(K,W)的RDD 上调用,返回一个(K,(Iterable<V>,Iterable<W>))类型的 RDD。该模式允许不同组织共享云基础设施,并具有定制的特性以满足特定社区的需求,同时兼顾安全性、隐私性和合规性方面的考量。注解:分区为2的情况下,一个分区是1,2, 一个分区是3,4;对于一个分区来说,数据的执行是有序的,
2024-01-26 12:31:58 1215
原创 云计算与云存储 期中试卷
窄依赖:是指每个父RDD的一个Partition最多被子RDD的一个Partition所使用,例如map、 filter、union等操作都会产生窄依赖;(独生子女)宽依赖:是指一个父RDD的Partition会被多个子RDD的Partition所使用,例如groupByKey、 reduceByKey、sortByKey等操作都会产生宽依赖;(超生)
2024-01-26 11:28:58 1060
原创 NLP过程性考核题目
答:句子的联合概率分布表示为条件概率乘积的形式,第 n 个词出现的概率将由第 1,…越长,其发生概率将越小,即n 越大模型越准确,但模型需要的参数变多,需要的训练语料变多。先通过点积运算计算编码器中的每一个隐藏状态与解码器中的前一个隐藏状态之间的相关性。(4)当误差大于我们的期望值时,将误差传回网络中,计算各层的误差。矩阵中只有当前已生成的(已翻译的)文本的信息,通过与编码器提供的。个假设中的每一个假设被传送至不同的解码器中,并使用下一个可能的。5.神经网络的权重是如何更新的,从模型初始运行开始描述。
2024-01-26 10:46:11 843
原创 知识图谱导论期末复习
属性图、RDF(向上对接OWL等更丰富的语义表示和推理能力, 向下对接简化后的属性图数据库以及图计算引擎)、RDFS、OWL。基于嵌入学习:嵌入模型:TransE、TransH、TransR、TransD、DistMult。语义搜索、知识问答、辅助推荐、辅助大数据分析、辅助语言理解、辅助视觉理解。排序模型:基于特征、基于子图匹配、基于向量表示、基于记忆网络。基于模板、基于监督学习、基于机器学习、基于预训练语言模型。方法:术语匹配(基于字符串、基于语言)、结构匹配。医疗健康、金融、农业、电商、通信。
2024-01-26 10:31:01 730
原创 判断一个无向图是否是一棵树
对边数的判定:使用深度优先搜索,在遍历图的过程中统计可能访问到的顶点个数和边的条数。G是一棵树的条件:(1)G是无回路的连通图 (2)或有n-1条边的连通图。对连通的判定:能否一次遍历全部顶点。
2024-01-15 17:05:42 533
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人