import pandas as pd
# 合并多个DataFrame
pd.concat(orderList)
# DataFrame去重
df..drop_duplicates()
# 对某列的字符串进行替换
# 例如这个对CSV的列的"="""替换掉等号,但是数据格式不会改变,所以可以先导出csv或者Excel再加载进来
DataFrame['订单编号']=DataFrame['订单编号'].str.replace('=\"','')
# 条件更新
DataFrame['country']=np.where(DataFrame['country']=='',DataFrame['country'],DataFrame['country_region'])
# 两个进行合并
pd.merge(itemDataFrame,orderDataFrame,how='left',on = '订单编号')
# 对某列的条件筛选
result=result[result['订单状态']!='交易关闭']
# 对某列进行字符串截取
result['订单创建时间']=result['订单创建时间'].str[0:10]
# 分类汇总
price=result.loc[:,['订单创建时间','价格']].groupby(['订单创建时间']).sum()
# 多列分类汇总,汇总完需要reset_index,否则输出会缺少汇总的列“订单创建时间”
result=result.groupby(by=['订单创建时间']).agg({'价格': sum, '购买数量':sum, '成本':sum, '利润':sum})
result=result.reset_index()
# 对列重命名
result=result.rename(columns={'订单创建时间':'日期','价格':'收入','购买数量':'销量','成本':'产品成本','利润':'毛利'})
# 对某列的nan填充为0
result['广告费']=result['广告费'].fillna(0)
# 删除掉某列
result=result.drop(['毛利'],axis=1)
# 删掉某行
# df = df.drop(df[<some boolean condition>].index)
# 保存到CSV
DataFrame.to_csv(rootdir+"\\temp.csv", sep=',', na_rep='', index=False, encoding='utf-8')
# 直接保存到数据库
from sqlalchemy import create_engine
connect=create_engine("mysql+pymysql://root:password@localhost:3306/stocks_db?charset=utf8")
pd.io.sql.to_sql(data,"stock_basic",connect,schema='stocks_db',if_exists="replace")
Pandas常用操作
于 2022-02-11 12:07:46 首次发布