Pandas 是一个用于数据分析的 Python 库,它提供了类似于 Excel 表格的数据结构和许多函数,用于处理、分析和操作数据。下面是一些在 Excel 中常用的函数,以及在 Pandas 中的相应实现:
- Excel中
SUM
求和函数
df[' '].sum()
- Excel中
AVERAGE
平均值函数
df[' '].mean()
- Excel中
COUNT
计数函数
df[' '].count()
- Excel中
VLOOKUP
垂直查找函数
merged_df = pd.merge(df1, df2, how='inner', left_on='key_column', right_on='key_column')
how
用于指定合并的方式
left_on
和right_on
分别用于指定左侧和右侧数据框中用于合并的列
- Excel中
HLOOKUP
水平查找函数
- Pandas中通过转置为
DataFrame
,然后使用merge()
函数进行垂直合并
transposed_df = df.transpose()
- Excel中
INDEX
和MATCH
索引和匹配函数
value = df.loc[df['column_name'] == '特定值', 'other_column'].values[0]
- Excel中
CONCATENATE
连接文本函数
- Pandas中使用
+
或者·str.cat()
进行文本连接
df['new_column'] = df['column1'] + ' ' + df['column2']
df['new_column'] = df['column1'].str.cat(df['column2'], sep=' ')
- Excel中
LEFT
、RIGHT
和MID
提取文本函数
- Pandas中使用字符串方法
str.slice()
df['left_part'] = df['column'].str.slice(0, 3)
- Excel中
IFERROR
处理错误函数
- Pandas中使用
try-except
结构来处理错误
try:
result = 1 / 0
except ZeroDivisionError:
result = "错误"
- Excel中
SUMIF
和SUMIFS
带条件的求和函数
sum_condition = df[df['column_condition'] > 50]['column_to_sum'].sum()
sum_condition = df[(df['column1'] == '条件1') & (df['column2'] > 5)]['co