import pandas as pd
""" 2.创建 DataFrame"""
# 从列表创建
df = pd.DataFrame(data=[['Alice', 25], ['Bob', 30], ['Charlie', 35]], columns=['Name', 'Age'])
# 从字典创建
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
"""3、DataFrame"""
# 查看前几行,默认为前5行
df.head()
# 查看后几行,默认为后5行
df.tail()
# 查看 DataFrame 的概览信息
df.info()
# 查看 DataFrame 的统计摘要
df.describe()
""" 4、选择数据 """
# 选择列
df['Name']
# 选择多列
df[['Name', 'Age']]
# 选择行
df.loc[0] # 通过索引位置选择
df.loc[df['Age'] > 30] # 通过条件选择
# 选择特定行和列
df.loc[df['Age'] > 30, 'Name']
""" 5、添加和修改数据 """
# 添加新列
df['Salary'] = [50000, 60000, 70000]
# 修改某列的值
df.loc[1, 'Age'] = 31
# 修改列名
df.rename(columns={'Age':'age', 'Name':'name'}, inplace = True)
# 修改列的格式
data[["Salary"]] = data[["Salary"]].astype(str)
""" 6、删除数据"""
# 删除列
df.drop('Age', axis=1, inplace=True)
# 删除行
df.drop(0, inplace=True)
""" 7、数据排序"""
# 按列排序
df.sort_values('Age')
# 按列降序排序
df.sort_values('Age', ascending=False)
""" 8、数据过滤"""
# 根据条件过滤行
df_filtered = df[df['Age'] > 30]
# 多重条件过滤
df_filtered = df[(df['Age'] > 30) & (df['Salary'] > 60000)]
""" 9、数据分组与聚合"""
# 按列分组并对分组后的数据进行聚合操作
df_grouped = df.groupby('Name').mean()
# 应用多个聚合函数
df_grouped = df.groupby('Name').agg({'Age': 'mean', 'Salary': 'sum'})
""" 10、数据合并"""
# 合并两个 DataFrame
merged_df = pd.concat([df1, df2])
# 根据列进行合并
merged_df = pd.merge(df1, df2, on='ID')
pandas 常见操作
最新推荐文章于 2024-11-03 00:03:15 发布