Pandas常用的30个经典操作以及代码演示

python茶水实验室

于 2024-07-15 16:34:56 发布

阅读量187

点赞数 2

文章标签： python 开发语言 scikit-learn pyqt beautifulsoup numpy pandas

本文链接：https://blog.csdn.net/2301_80410418/article/details/140442622

版权

首先,我们创建一个示例DataFrame：

import pandas as pd

# 创建示例DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix'],
    'Salary': [70000, 80000, 60000, 90000, 85000]
}
df = pd.DataFrame(data)
print("Original DataFrame:")
print(df)

1.查看DataFrame的基本信息

print("\n1. 查看DataFrame的基本信息:")
print(df.info())

2.查看DataFrame的头部几行

print("\n2. 查看DataFrame的头部几行:")
print(df.head(3))

3.查看DataFrame的尾部几行

print("\n3. 查看DataFrame的尾部几行:")
print(df.tail(3))

4.描述性统计信息

print("\n4. 描述性统计信息:")
print(df.describe())

5.选择单列

print("\n5. 选择单列:")
print(df['Age'])

6.选择多列

print("\n6. 选择多列:")
print(df[['Name', 'Salary']])

7.选择行

print("\n7. 选择行:")
print(df.loc[1])

8.基于条件选择行

print("\n8. 基于条件选择行:")
print(df[df['Age'] > 25])

9.添加新列

print("\n9. 添加新列:")
df['Experience'] = [1, 5, 2, 8, 6]
print(df)

10.删除列

print("\n10. 删除列:")
df = df.drop('Experience', axis=1)
print(df)

11.删除行

print("\n11. 删除行:")
df = df.drop(4)
print(df)

12.重命名列

print("\n12. 重命名列:")
df = df.rename(columns={'Name': 'Employee Name'})
print(df)

13.设置索引

print("\n13. 设置索引:")
df = df.set_index('Employee Name')
print(df)

14.重置索引

print("\n14. 重置索引:")
df = df.reset_index()
print(df)

15.检查空值

print("\n15. 检查空值:")
print(df.isnull())

16.填充空值

print("\n16. 填充空值:")
df.loc[2, 'City'] = None
df['City'] = df['City'].fillna('Unknown')
print(df)

17.丢弃空值

print("\n17. 丢弃空值:")
df.loc[2, 'City'] = None
df = df.dropna()
print(df)

18.排序

print("\n18. 排序:")
print(df.sort_values(by='Salary', ascending=False))

19.按索引排序

print("\n19. 按索引排序:")
print(df.sort_index())

20.分组

print("\n20. 分组:")
grouped = df.groupby('City').mean()
print(grouped)

21.合并DataFrame

print("\n21. 合并DataFrame:")
df1 = pd.DataFrame({
    'Name': ['Alice', 'Bob'],
    'Hobby': ['Reading', 'Swimming']
})
merged = pd.merge(df, df1, left_on='Employee Name', right_on='Name', how='left')
print(merged)

22.连接DataFrame

print("\n22. 连接DataFrame:")
df2 = pd.DataFrame({
    'Employee Name': ['Alice', 'Bob'],
    'Hobby': ['Reading', 'Swimming']
})
joined = df.join(df2.set_index('Employee Name'), on='Employee Name', how='left')
print(joined)

23.数据透视表

print("\n23. 数据透视表:")
pivot = df.pivot_table(values='Salary', index='City', aggfunc='mean')
print(pivot)

24.转置

print("\n24. 转置:")
print(df.T)

25.计算列的均值

print("\n25. 计算列的均值:")
print(df['Age'].mean())

26.计算列的中位数

print("\n26. 计算列的中位数:")
print(df['Age'].median())

27.计算列的标准差

print("\n27. 计算列的标准差:")
print(df['Salary'].std())
28. 应用函数到列
print("\n28. 应用函数到列:")
df['Age in 10 Years'] = df['Age'].apply(lambda x: x + 10)
print(df)

29.获取唯一值

print("\n29. 获取唯一值:")
print(df['City'].unique())

28.计算值的出现频率

print("\n30. 计算值的出现频率:")
print(df['City'].value_counts())

你可以在你的Python环境中运行这些代码块来体验这些操作。如果有任何问题或需要进一步的解释，请告诉我！
感谢大家的关注和支持!想了解更多Python编程精彩知识内容,请关注我的 微信公众号:python小胡子,有最新最前沿的的python知识和人工智能AI与大家共享,同时,如果你觉得这篇文章对你有帮助,不妨点个赞,并点击关注.动动你发财的手,万分感谢!!!
原创文章不易,求点赞、在看、转发或留言,这样对我创作下一个精美文章会有莫大的动力！