Python和R语言for循环新手入门必学教程

最新推荐文章于 2024-08-12 01:03:38 发布

生信分析笔记

最新推荐文章于 2024-08-12 01:03:38 发布

阅读量730

点赞数 14

文章标签：后端

本文链接：https://blog.csdn.net/zaojewin/article/details/137511676

版权

本文详细比较了Python和R语言中的for循环，包括基本用法、高级技巧如列表推导、嵌套循环和并行处理，以及注意事项，帮助读者理解和掌握这两种语言的循环机制。

摘要由CSDN通过智能技术生成

Python和R语言之for循环

在数据分析或者日常工作中，经常遇到需要循环处理的情况，此时可以使用编程语言中的for循环来实现简单的操作，今天的笔记分享关于Python和R语言中常用的for循环方法和使用技巧。

Python中的for循环

在Python中，for循环是一种常用的迭代结构，用于遍历序列（如列表、元组、字符串）或其他可迭代对象。在实际编程中经常会遇到循环迭代的情况，下面是一些基本的使用方法、技巧和示例：

基本用法

遍历列表：

fruits = ["apple", "banana", "cherry"]
for fruit in fruits:
    print(fruit)

遍历范围（range）：

for i in range(5):  # 这将输出0到4
    print(i)

遍历字典：

my_dict = {'a': 1, 'b': 2, 'c': 3}
for key in my_dict:
    print(key, my_dict[key])

高级用法

列表推导式：

用于创建新的列表，它的结构更简洁

squares = [x**2 for x in range(10)]

同时遍历多个序列：

使用zip()函数

names = ["Steve", "Bill", "Linus"]
hobbies = ["Fishing", "Reading", "Coding"]
for name, hobby in zip(names, hobbies):
    print(f"{name} likes {hobby}")

带索引的遍历：

使用enumerate()函数

for index, fruit in enumerate(fruits):
    print(index, fruit)

字典的items()方法：

同时遍历键和值

for key, value in my_dict.items():
    print(key, value)

break和continue：

break用于完全退出循环，continue用于跳过当前迭代进入下一次迭代。

R语言中跳过当前循环使用next命令

for num in range(10):
    if num == 5:
        break  # 结束循环
    if num % 2 == 0:
        continue  # 跳过偶数
    print(num)  # 打印奇数直到5

循环中使用else子句：

当循环正常结束时执行else块，即未遭遇break时。

for num in range(3):
    print(num)
else:
    print("Loop finished")

R语言中的for循环

相比于Python来说，R语言的for循环逻辑相同，但是在代码格式上有所不同，尤其是在缩进和括号的使用上，Python中由于缩进规则所以不需要将循环体进行括号，但是R语言中需要将循环体放在括号中，以下是几个例子：

基本用法

遍历向量：

for (val in c(1, 2, 3, 4, 5)) {
  print(val)
}

遍历序列：

for (i in 1:5) {
  print(i)
}

遍历列名或行名：

df <- data.frame(a = 1:3, b = 4:6, c = 7:9) # 创建一个数据框
for (colname in colnames(df)) {
  print(paste("Column name:", colname))
}

高级用法和技巧

嵌套循环：

对数据的更复杂处理，例如处理多维数组或列表。

for (i in 1:3) {
  for (j in 1:2) {
    print(paste("Element [", i, ",", j, "]", sep = ""))
  }
}

避免显式循环：

在R语言中，经常可以通过向量化操作或使用apply系列函数（如sapply、lapply等）来避免显式循环，这样做通常更高效。

# 使用sapply代替循环
result <- sapply(1:5, function(x) x^2)

使用seq_along和seq_len：这两个函数在循环中非常有用，尤其是当需要遍历的对象的长度可能为0时。

# 使用seq_along安全遍历向量
vec <- 1:5
for (i in seq_along(vec)) {
  print(vec[i])
}

# 使用seq_len生成序列
for (i in seq_len(5)) {
  print(i)
}

预分配内存：

在进入循环之前，为将要生成的结果预分配内存，可以提高循环的效率。

# 预分配内存
result <- vector("numeric", length = 5)
for (i in 1:5) {
  result[i] <- i^2
}

并行处理：

对于较大的数据集和复杂的计算，可以使用并行处理来加速循环，R包如parallel和foreach提供了这样的功能。

library(parallel)
no_cores <- detectCores() - 1
result <- mclapply(1:5, function(x) x^2, mc.cores = no_cores)

注意事项与七个技巧

在使用循环操作时，无论是在Python、R语言还是其他编程语言中，有几个通用的注意事项：

避免无限循环

确保循环有一个明确的终止条件，无限循环会导致程序挂起或崩溃，消耗大量系统资源。

使用向量化操作（特别是在R语言中）

尽可能使用向量化操作替代显式循环。在R语言中，向量化操作通常比等价的循环更高效，Python的NumPy库也提供了向量化计算能力。

预分配内存

在开始循环之前，为将要存储的数据预分配足够的内存空间，动态增长数据结构（如列表或向量）可能会显著降低循环的效率。

减少循环内部的计算负载

尽量减少循环体内部的计算量和复杂操作。如果某些计算可以在循环外部完成，则应该将其移出循环。

使用合适的循环控制语句

合理使用break、continue（Python）或next、break（R语言）等控制语句来管理循环的流程。

考虑使用并行处理

对于大数据集或计算密集型任务，考虑使用并行处理来加速循环，许多现代编程语言都提供了并行和异步执行的工具。

注意作用域问题

在循环中定义的变量会在循环外部保留（除非在函数中定义的循环）。确保不会无意中使用循环外的变量，或者在循环外部错误地重复使用循环内定义的变量。

本文由 mdnice 多平台发布

生信分析笔记

关注

14
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python和R语言for循环新手入门必学教程

在数据分析或者日常工作中，经常遇到需要循环处理的情况，此时可以使用编程语言中的for循环来实现简单的操作，今天的笔记分享关于Python和R语言中常用的for循环方法和使用技巧。在循环中定义的变量会在循环外部保留（除非在函数中定义的循环）。对于较大的数据集和复杂的计算，可以使用并行处理来加速循环，R包如parallel和foreach提供了这样的功能。在开始循环之前，为将要存储的数据预分配足够的内存空间，动态增长数据结构（如列表或向量）可能会显著降低循环的效率。对数据的更复杂处理，例如处理多维数组或列表。
复制链接

扫一扫