高性能计算中常用的一些术语及概念

近期试用超算,经常碰到一些HPC中的一些术语,这里试着总结下

核(core)
实际执行指令的硬件计算单元。通常,一个处理器中有多个内核

插槽(socket)
一组共享本地的核心,例如共享的缓存。这使得将计算工作分布在插槽内的内核上比分布在不同插槽内的内核上更为有效。现代处理器通常具有多个插槽。

节点(node)

一组共享本地的socket,例如,无需任何网络硬件即可共享对同一内存的访问。普通笔记本电脑或台式计算机是一个节点。节点通常是用户可以请求使用的大型计算集群中的最小数量。

线程(thread)
内核执行的指令流。有许多不同的编程来创建和管理在多个线程上的扩展计算,例如OpenMP,pthreads,winthreads,CUDA,OpenCL和OpenACC。某些类型的硬件可以将一个以上的软件线程映射到一个内核。在Intel x86处理器上,这称为“超线程”,而更笼统的概念通常称为“同时多线程”的SMT。例如,IBM Power8每个核心最多可以使用8个硬件线程。通常可以在硬件BIOS中或通过Linux操作系统中的设置启用或禁用此功能。

MPI
主导的多节点并行化方案,提供了一种标准化的语言,可以使用该语言编写跨多个节点工作的程序。

进程(rank)
在MPI中,rank是多节点并行化方案中使用的最小硬件分组。该分组可由用户控制,并且可能对应于核心,插槽,节点或一组节点。最佳选择随硬件,软件和计算任务的不同而不同。有时,一个MPI rank 被称为一个 MPI process。

GPU
图形处理单元,对于特定种类的计算工作负载,通常比常规处理器更快,更高效。GPU始终与特定节点关联,并且通常与该节点内的特定插槽关联。

OpenMP
许多编译器支持的一种标准化技术,可以在多个内核上共享计算工作负载。通常与MPI结合使用以实现MPI / OpenMP混合并行性。

CUDA
由NVIDIA开发的专有并行计算框架和API,可以针对其加速器硬件。GROMACS使用CUDA对NVIDIA硬件进行GPU加速支持。

OpenCL的
一个基于开放标准的并行计算框架,该框架包括一个基于C99的编译器和一个针对异构硬件和加速器硬件的编程API。

SIMD
一种CPU指令,现代CPU内核可通过这种指令在单个周期内执行多个浮点指令。

这里Rank 和 thread 区别,可以把任务分为多个 rank, 而一个rank 中又可以运行多个 thread

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在深度学习过程,需要掌握以下一些重要的概念和名词: 1. 神经网络(Neural Network):由人工神经元组成的计算模型,用于学习从输入数据提取特征,并进行预测或分类等任务。 2. 激活函数(Activation Function):在神经网络,激活函数将输入信号转换为输出信号。常见的激活函数包括Sigmoid、ReLU、Tanh等。 3. 前向传播(Forward Propagation):神经网络的前向传播是指从输入层到输出层的信号传递过程,通过对权重和激活函数的计算,得到最终的输出结果。 4. 反向传播(Backpropagation):反向传播是训练神经网络的关键步骤。它通过计算损失函数对网络参数的梯度,并将梯度从输出层传递回输入层,以更新网络的权重。 5. 损失函数(Loss Function):用于衡量神经网络预测结果与真实标签之间的差异。常见的损失函数包括均方误差(Mean Squared Error)、交叉熵(Cross Entropy)等。 6. 优化算法(Optimization Algorithm):用于更新神经网络权重以最小化损失函数的算法。常见的优化算法包括梯度下降(Gradient Descent)、Adam、RMSProp等。 7. 批量训练(Batch Training):将训练样本分成多个批次进行训练,每个批次都会计算损失函数并更新权重。批量训练有助于提高训练效率和稳定性。 8. 过拟合(Overfitting):指模型在训练集上表现良好,但在未见过的数据上表现较差的现象。过拟合通常发生在模型过于复杂或训练数据不足时。 9. 学习率(Learning Rate):优化算法用于控制权重更新幅度的参数。过高的学习率可能导致不稳定的训练,而过低的学习率可能导致收敛速度慢。 10. 超参数(Hyperparameters):在深度学习指那些需要手动设置的参数,如学习率、批次大小、网络层数等。超参数的选择对模型性能和训练效果有重要影响。 这些是深度学习一些重要的概念和名词,但深度学习领域还有更多的术语概念。在学习深度学习时,建议深入了解这些概念,并阅读相关文献和教程以获取更全面的知识。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值