【性能】【算法】for循环,性能提高

23 篇文章 3 订阅

目录

■提高性能的方法

・原理

1.1.java处理中,计算阶乘,为什么展开循环可以提高效率

1.2.从cpu的流水线角度,再说明一下

1.3.介绍一下 cup的指令流水线

■实际运用

1.求和

代码

结果  

2.求阶乘 (性能提高效果明显)

代码

结果

测试电脑性能

自己电脑

堆内存并非越大,效率越高!!!!!!

电脑001

电脑002(虚拟机,公用一个cup)

媳妇的电脑

堆内存并非越大,效率越高!!!!!!!

爸爸的电脑


====

■提高性能的方法

通过展开循环,提高效率。

(算法,CPU原理)

・原理

1.1.java处理中,计算阶乘,为什么展开循环可以提高效率

展开循环可以提高效率的原因是避免了重复的循环操作。在计算阶乘的过程中,我们需要对一个数从1乘到该数本身,如果使用循环来实现这个操作,就需要每次都进行一次循环迭代,直到达到该数。而展开循环的方式,可以直接将每一次循环的结果串联起来,避免了重复的循环操作。

---

举个例子,假设要计算5的阶乘。使用循环的方式,需要进行5次循环迭代,分别计算1x2、2x3、3x4、4x5,最后得到120。而展开循环的方式,可以直接计算1x2x3x4x5,得到结果120,避免了重复的循环操作。

--

因此,展开循环可以减少循环迭代次数,提高运算效率。但需要注意的是,展开循环在处理大数阶乘时可能会造成溢出问题,需要进行适当的优化处理。

1.2.从cpu的流水线角度,再说明一下

https://rcwap.com/newsdetail_630.html

从CPU流水线的角度来看,展开循环可以提高效率的原因是减少了分支(branch)导致的流水线停顿(pipeline stall)。

----

在计算阶乘的过程中,循环结构通常会引入条件分支,用于判断循环是否继续。当分支预测(branch prediction)失败时,CPU的流水线会发生停顿,等待分支判断结果返回。这会导致流水线中断,浪费了一些CPU周期。

----

而如果采用展开循环的方式,即在代码中展开多个循环迭代,相当于将多个循环迭代的结果直接写入代码中。这样就避免了循环和条件分支的存在,减少了分支预测失败的机会,减少了流水线停顿。

---

通过减少流水线停顿,CPU可以更充分地利用流水线的并行性和吞吐量,提高指令的执行效率,加快计算阶乘的速度。

---

但是需要注意,展开循环也会增加代码量,可能会导致代码膨胀和缓存不命中等问题,因此在选择是否展开循环时需要综合考虑代码大小、缓存使用情况以及具体的计算规模来做出决策。

1.3.介绍一下 cup的指令流水线

CUP(Control Unit Pipeline)是计算机的一种指令流水线执行方式。它将计算机的指令执行过程分为多个阶段,并且每个阶段由一个专门的硬件单元来处理。这种流水线执行方式可以提高计算机的效率和性能。

CUP的指令流水线一般包括以下几个阶段:

  1. 取指令阶段(Instruction Fetch):从指令存储器中读取下一条指令,并将其送入指令译码器。

  2. 指令译码阶段(Instruction Decode):将指令译码为包含操作码和操作数的控制信号。

  3. 执行阶段(Execution):根据控制信号执行指令中的操作,并产生需要的结果。

  4. 访存阶段(Memory Access):如果指令需要访问内存,则进行内存读取或写入操作。

  5. 写回阶段(Write Back):将执行结果写回到寄存器文件或存储器中。

CUP的指令流水线可以并行地执行多条指令,从而实现指令的重叠执行。当一条指令在某个阶段执行时,下一条指令可以开始在前一个阶段进行处理。这样可以大大缩短指令的执行时间,提高计算机的吞吐量。

然而,CUP的指令流水线也存在一些问题。例如,由于指令之间可能存在数据依赖关系,需要进行冒险(Hazard)处理;还可能存在控制依赖问题,需要进行分支预测等。因此,在设计CUP指令流水线时,需要考虑这些问题,并采取相应的策略来解决。

xxx

https://rcwap.com/newsdetail_630.html

=======

■实际运用

1.求和

代码

package com.sxz.study.alogrithm;

public class TestAlogrithom {

	public static void main(String[] args) {

		long timeBegin = 0;
		long timeEnd =0;
		
		
		timeBegin = System.currentTimeMillis();
		long result1 = calc001(1000000000);
		System.out.println(result1);
		timeEnd = System.currentTimeMillis();
		System.out.println(timeEnd-timeBegin);
		
		timeBegin = System.currentTimeMillis();
		long result2 = calc002(1000000000);
		System.out.println(result2);
		timeEnd = System.currentTimeMillis();
		System.out.println(timeEnd-timeBegin);
		
	}

	public static long calc001(int sumNumber) {
		long count = 0;

		for (int i = 1; i <= sumNumber; i++) {
			count += i;
		}

		return count;

	}

	public static long calc002(int sumNumber) {
		long count1 = 0, count2 = 0, count3 = 0, count4 = 0;
		
		// 假设,sumNuber 是4的倍数
		for (int i = 1; i <= sumNumber; i+=4) {
			count1 += i;
			count2 += i+1;
			count3 += i+2;
			count4 += i+3;
		}

		return count1 + count2 + count3 + count4;

	}
	
	

}

结果  

性能提高 了近14% (299258

(299-258)/ 299 = 13.71%

299 / 258 =1.1589

改善后,速度是之前的1.16倍

500000000500000000
299
500000000500000000
258

----------------------

2.求阶乘 (性能提高效果明显)

代码

package com.sxz.study.alogrithm;
 
import java.math.BigDecimal;
 
public class TestAlogrithom2 {
 
	public static void main(String[] args) {
 
		long timeBegin = 0;
		long timeEnd =0;
		
		
		timeBegin = System.currentTimeMillis();
		BigDecimal result1 = calc001(10000);
		System.out.println(result1);
		timeEnd = System.currentTimeMillis();
		System.out.println((timeEnd-timeBegin)+"ms");
		
		timeBegin = System.currentTimeMillis();
		BigDecimal result2 = calc002(10000);
		System.out.println(result2);
		timeEnd = System.currentTimeMillis();
		System.out.println((timeEnd-timeBegin)+"ms");
		
	}
 
	public static BigDecimal calc001(int sumNumber) {
		BigDecimal count = new BigDecimal(1);
 
		for (int i = 1; i <= sumNumber; i++) {
			count = count.multiply(new BigDecimal(i));
		}
 
		return count;
 
	}
 
	public static BigDecimal calc002(int sumNumber) {
		BigDecimal count1 = new BigDecimal(1);
		BigDecimal count2 = new BigDecimal(1);
		BigDecimal count3 = new BigDecimal(1);
		BigDecimal count4 = new BigDecimal(1);
		
		
		
		// 假设,sumNuber 是4的倍数
		for (int i = 1; i <= sumNumber; i+=4) {
			count1 = count1.multiply(new BigDecimal(i));
			count2 = count2.multiply(new BigDecimal(i+1));
			count3 = count3.multiply(new BigDecimal(i+2));
			count4 = count4.multiply(new BigDecimal(i+3));
		}
 
		return count1.multiply(count2).multiply(count3).multiply(count4);
 
	}
	
	
 
}

结果

性格提高了近69%%  (92 ⇒ 29)

(92-29)/ 2 = 68.47

92/29 = 3.17

改善后,速度是之前的三倍。

2846..........0000
92
2846..........0000
29

===

测试电脑性能

自己电脑

小米 笔记本 Pro 点击excel 文件夹 未响应 卡死 如何解决_小米笔记本文件夹未响应-CSDN博客

==

命令行执行

堆内存并非越大,效率越高!!!!!!

==

电脑001

电脑002(虚拟机,公用一个cup)

70~110,30~60

媳妇的电脑

chcp 65001

javac -encoding UTF-8 -d . TestAlogrithom2.java

java com.sxz.study.alogrithm.TestAlogrithom2 | findstr "ms"

java -Xms2g com.sxz.study.alogrithm.TestAlogrithom2 | findstr "ms"

堆内存并非越大,效率越高!!!!!!!

指定堆内存 2g(-xms2g)

78,31

指定堆内存 256m(-xms256m)

78,16

不指定堆内存

79,15

====

爸爸的电脑

xx

==

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python 中的 for 循环性能受到多种因素的影响,包括循环次数、循环体中的操作、数据类型等。以下是一些提高 for 循环性能的方法: 1. 使用 xrange() 函数代替 range() 函数,特别是在需要遍历大量数据时。xrange() 函数返回一个迭代器,不会生成整个序列,从而避免了内存占用过高的问题。 2. 避免在循环体中进行重复计算。如果在循环体中需要进行复杂的计算,可以将计算结果缓存起来,避免重复计算。 3. 尽量使用内置函数和模块提供的高效操作。例如,使用内置函数的 map()、filter()、reduce() 等,或者使用 NumPy、Pandas 等科学计算库中提供的高效操作。 4. 尽量避免在循环体中进行频繁的数据类型转换。例如,对于字符串拼接操作,可以使用列表拼接后再使用 join() 方法,避免频繁的字符串拼接操作。 5. 尽量避免在循环体中进行 I/O 操作。例如,读写文件、访问网络等操作应该尽量放在循环体外部,避免频繁的 I/O 操作。 6. 对于多层嵌套的循环,可以考虑使用并行计算来提高效率。Python 中有多种并行计算的方式,例如使用 multiprocessing、concurrent.futures 等模块,可以利用多核 CPU 来加速计算。 总的来说,提高 Python for 循环性能需要综合考虑多个因素,选择合适的数据结构和算法,避免不必要的计算和操作,以及充分利用 Python 提供的高效计算工具和并行计算方式。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值