本文主要完成Python工具—pandas相关搬运工作
。
目录
2. 功能
2.1 groupby函数
主要的作用是进行数据的分组以及分组后地组内运算!
import pandas as pd
df = pd.DataFrame({'key1': list('aabba'),
'key2': ['one', 'two', 'one', 'two', 'one'],
'data1': np.random.randn(5),
'data2': np.random.randn(5)})
df
-
使用单特征对表格进行划分
grouped = df.groupby(['key1']).mean() grouped
-
使用多特征对表格进行划分
grouped = df.groupby(['key1','key2']).mean() grouped
-
输出风格
as_index = False实际上是“SQL风格”的分组输出,对比结果
grouped = df.groupby(['key1','key2'],as_index=False).mean() grouped
2.3 pandas两列实现“连接+”操作
padas对于两列想实现连接操作,如3+4=34 而非3+4=7 可以将类型转化为str类型map(str):
df["meg"]=df["key1"].map(str)+df["key2"].map(str)
2.4 重新命列名
df=df.rename(columns={"key1": "item1", "key2": "item2"})
df
2.5 判断dataframe是否为空
2.6 筛选多列、去重
df_type = data_sales[['type']].drop_duplicates()
2.7 序号重排
df_sales_sortcate = df_sales_sortcate.reset_index(drop=True)
2.8 df.plot()
详细部署信息见参考资料1.
参考资料
- 这里是引用