有10个数据框df1,df2,df3....df10,具有相同的列,统计每个数据框中其中一列分别有多少值
# 创建包含所有数据框的列表
data_frames = [df1, df2, df3, df4, df5, df6, df7, df8, df9, df10]
# 创建一个空列表来存储每个数据框中 "column_name" 列的值数量
value_counts = []
# 遍历每个数据框,统计 "column_name" 列的值数量
for df in data_frames:
count = df["column_name"].count() # 统计非缺失值的数量
value_counts.append(count)
# 打印每个数据框中 "column_name" 列的值数量
for i, count in enumerate(value_counts):
print(f"df{i+1}: {count} values")
当含有多个arrays时,想要选择其中共有的内容,可用下面的代码
import numpy as np
from functools import reduce
arr1 = np.array([1, 2, 3, 4, 5])
arr2 = np.array([3, 4, 5, 6, 7])
arr3 = np.array([5, 6, 7, 8, 9])
# ... 其他数组
arrays = [arr1, arr2, arr3, ...] # 包含所有数组的列表
common_elements = reduce(np.intersect1d, arrays)
print(common_elements)