首先,我们创建一个示例DataFrame:
import pandas as pd
# 创建示例DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [24, 27, 22, 32, 29],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix'],
'Salary': [70000, 80000, 60000, 90000, 85000]
}
df = pd.DataFrame(data)
print("Original DataFrame:")
print(df)
1.查看DataFrame的基本信息
print("\n1. 查看DataFrame的基本信息:")
print(df.info())
2.查看DataFrame的头部几行
print("\n2. 查看DataFrame的头部几行:")
print(df.head(3))
3.查看DataFrame的尾部几行
print("\n3. 查看DataFrame的尾部几行:")
print(df.tail(3))
4.描述性统计信息
print("\n4. 描述性统计信息:")
print(df.describe())
5.选择单列
print("\n5. 选择单列:")
print(df['Age'])
6.选择多列
print("\n6. 选择多列:")
print(df[['Name', 'Salary']])
7.选择行
print("\n7. 选择行:")
print(df.loc[1])
8.基于条件选择行
print("\n8. 基于条件选择行:")
print(df[df['Age'] > 25])
9.添加新列
print("\n9. 添加新列:")
df['Experience'] = [1, 5, 2, 8, 6]
print(df)
10.删除列
print("\n10. 删除列:")
df = df.drop('Experience', axis=1)
print(df)
11.删除行
print("\n11. 删除行:")
df = df.drop(4)
print(df)
12.重命名列
print("\n12. 重命名列:")
df = df.rename(columns={'Name': 'Employee Name'})
print(df)
13.设置索引
print("\n13. 设置索引:")
df = df.set_index('Employee Name')
print(df)
14.重置索引
print("\n14. 重置索引:")
df = df.reset_index()
print(df)
15.检查空值
print("\n15. 检查空值:")
print(df.isnull())
16.填充空值
print("\n16. 填充空值:")
df.loc[2, 'City'] = None
df['City'] = df['City'].fillna('Unknown')
print(df)
17.丢弃空值
print("\n17. 丢弃空值:")
df.loc[2, 'City'] = None
df = df.dropna()
print(df)
18.排序
print("\n18. 排序:")
print(df.sort_values(by='Salary', ascending=False))
19.按索引排序
print("\n19. 按索引排序:")
print(df.sort_index())
20.分组
print("\n20. 分组:")
grouped = df.groupby('City').mean()
print(grouped)
21.合并DataFrame
print("\n21. 合并DataFrame:")
df1 = pd.DataFrame({
'Name': ['Alice', 'Bob'],
'Hobby': ['Reading', 'Swimming']
})
merged = pd.merge(df, df1, left_on='Employee Name', right_on='Name', how='left')
print(merged)
22.连接DataFrame
print("\n22. 连接DataFrame:")
df2 = pd.DataFrame({
'Employee Name': ['Alice', 'Bob'],
'Hobby': ['Reading', 'Swimming']
})
joined = df.join(df2.set_index('Employee Name'), on='Employee Name', how='left')
print(joined)
23.数据透视表
print("\n23. 数据透视表:")
pivot = df.pivot_table(values='Salary', index='City', aggfunc='mean')
print(pivot)
24.转置
print("\n24. 转置:")
print(df.T)
25.计算列的均值
print("\n25. 计算列的均值:")
print(df['Age'].mean())
26.计算列的中位数
print("\n26. 计算列的中位数:")
print(df['Age'].median())
27.计算列的标准差
print("\n27. 计算列的标准差:")
print(df['Salary'].std())
28. 应用函数到列
print("\n28. 应用函数到列:")
df['Age in 10 Years'] = df['Age'].apply(lambda x: x + 10)
print(df)
29.获取唯一值
print("\n29. 获取唯一值:")
print(df['City'].unique())
28.计算值的出现频率
print("\n30. 计算值的出现频率:")
print(df['City'].value_counts())
-
你可以在你的Python环境中运行这些代码块来体验这些操作。如果有任何问题或需要进一步的解释,请告诉我!
-
感谢大家的关注和支持!想了解更多Python编程精彩知识内容,请关注我的 微信公众号:python小胡子,有最新最前沿的的python知识和人工智能AI与大家共享,同时,如果你觉得这篇文章对你有帮助,不妨点个赞,并点击关注.动动你发财的手,万分感谢!!!
-
原创文章不易,求点赞、在看、转发或留言,这样对我创作下一个精美文章会有莫大的动力!