并行计算第一章

最新推荐文章于 2022-09-20 03:17:47 发布

又明

最新推荐文章于 2022-09-20 03:17:47 发布

阅读量281

点赞数 1

分类专栏：并行计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zacharyzqc/article/details/112257322

版权

并行计算专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一些准则：

1.Principle of locality of reference

(1)Locality of Reference

程序总是重用最近用过的指令和数据；如子程序和循环

在程序执行过程中，CPU对指令和数据的访问总是呈现集群化的趋势；顺序访问、表和数组

(2)A Rule of Thumb

90%的时间花费在10%的代码上

(3)Locality of reference includes

时间局部性：最近访问的指令和数据很有可能在最近还会被访问

空间局部性：与已被访问语句相邻的语句很有可能会被访问

(4)这个准则是缓存系统的理论基础

(5)结构局部性比数据局部性体现地更加明显

2.聚焦一般情况 Focusing on The Common Case

(1)In system design or project design,we must focus on the common case

The events occurred frequently

Optimizing the common case can improve the whole system performance

Focusing on infrequent events has no meanings

(2)如何优化？

更快的器件

并行计算、更好的算法

减少I/O和通信频率

3.Amdahl Law

(1)Amdahl Law

使用更快的执行模式所提高的性能受到更快的执行模式的执行时间在总执行时间中所占比例的限制

提高的性能受到使用更快模式的频率的限制

阿姆达尔定律定义了通过使用特定技术可以获得的加速

Sn ：总效率提升倍数

Tn：改进后所用时间

T0：改进前所用时间

Fe：要改进的部分占总时间的比例

Se：单个部分效率提升倍数

law of diminishing returns:仅改进一部分计算所获得的加速比增量改进随着改进的增加而减小

4.The Processor Performance Equation

单用核心数或时钟频率来表达CPU性能并不准确，用CPU时间(CPUy运行一个程序所需要的时间)更准确

  CPU time = CPU clock cycles for a program *clock cycle time = CPU clock cycles for a program/clock rate

  CPU time = CPI ×IC × clock cycle = CPI ×IC / clock rate

  CPI: cycles per instruction   IC: instruction count

处理器性能由三个参数决定:1.时钟频率2.每个指令需要的时钟周期(CPI)3.指令数目（IC）

RISC（精简指令集计算机） focusing on CPI, CISC（复杂指令集） focusing on IC，时钟频率所有CPU都关心。根据指令复杂度来区分 RISC和CISC，单个指令要的时间周期长，比较复杂是CISC

5.Reliability and availability

(1)Reliability用MTTF表示。MTTF: Mean Time to Failure

Rate of failures: 1/ MTTF

Failures per billion hours of operation

The unit is FIT (Failures in Time )

MTBF:Mean Time between Failures = MTTF+MTTR:Mean Time to Repair

(2)Availability=MTTF/(MTTF+MTTR)

computer evolution trends:

低端中端高端嵌入式

evolution trends of throughput and latency:

Throughput/bandwidth: 单位时间内完成的任务量,Developing very fast

Latency/Response Time : 从初始化一个事件到完成它所需时间, Developing slower than throughput

A rule of thumb: Throughput increasing speed at least squares latency improvement speed

Propagation Latency(传播延迟) =resistor(电阻) * capacitor（电容）

Intelligent computing system:

可高效执行AI运算的计算机：

1.云上集群、超级计算机、SMP(对称多处理器. 顾名思义, 在SMP中所有的处理器都是对等的, 它们通过总线连接共享同一块物理内存)、多GPU计算机

2.专用AI计算机深度学习计算机、AI CPU(Acend, Google TPU, Nvidia cuDNN,Cambricon)等

Machine learning types：

Supervised learning

Training set contains target

Unsupervised learning

No Data label in the training set

Reinforcement learning

Getting reward from interaction with environment

Trial and error

Evolutionary learning

1. 生成初始的解集

2. 基于当前的解集 , 利用启发式算法，产生新的解集

3. 移除一些表现差的解集

4. back to step 2,直到满足演化停止的条件

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
并行计算第一章

一些准则： 1.Principle of locality of reference (1)Locality of Reference 程序总是重用最近用过的指令和数据；如子程序和循环在程序执行过程中，CPU对指令和数据的访问总是呈现集群化的趋势；顺序访问、表和数组 (2)A Rule of Thumb 90%的时间花费在10%的代码上 (3)Locality of reference incl...
复制链接

扫一扫

专栏目录

又明 CSDN认证博客专家 CSDN认证企业博客

码龄6年

30: 原创

14万+: 周排名

148万+: 总排名

3万+: 访问

: 等级

654: 积分

9: 粉丝

22: 获赞

2: 评论

78: 收藏

私信

关注

分类专栏

论文阅读 1篇
SLAM 1篇
AI 2篇
并行计算 2篇
代码效率提升trick 1篇
视觉 1篇
C++udacity
概率机器人 1篇
xpytho 2篇
ros 10篇
ubuntu 3篇
C++ 9篇

最新评论

ROS cmakelist
ctotalk: good.
转载：编写 Matlab mexFunction （C mex）
Ld_111: 作者你好，我是matlab初学者，想问的是：1.那些if语句只是检查输入参数是否合格吗？2.len = (unsigned)(*n)，为什么右边表达式有数据声明？还望您帮忙解答一下，谢谢谢谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。