Pandas常用操作

import pandas as pd


# 合并多个DataFrame
pd.concat(orderList)

# DataFrame去重
df..drop_duplicates()

# 对某列的字符串进行替换
# 例如这个对CSV的列的"="""替换掉等号,但是数据格式不会改变,所以可以先导出csv或者Excel再加载进来
DataFrame['订单编号']=DataFrame['订单编号'].str.replace('=\"','')


# 条件更新
DataFrame['country']=np.where(DataFrame['country']=='',DataFrame['country'],DataFrame['country_region'])


# 两个进行合并
pd.merge(itemDataFrame,orderDataFrame,how='left',on = '订单编号')



# 对某列的条件筛选
result=result[result['订单状态']!='交易关闭']

# 对某列进行字符串截取
result['订单创建时间']=result['订单创建时间'].str[0:10]

# 分类汇总
price=result.loc[:,['订单创建时间','价格']].groupby(['订单创建时间']).sum()

# 多列分类汇总,汇总完需要reset_index,否则输出会缺少汇总的列“订单创建时间”
result=result.groupby(by=['订单创建时间']).agg({'价格': sum, '购买数量':sum, '成本':sum, '利润':sum})
result=result.reset_index()

# 对列重命名
result=result.rename(columns={'订单创建时间':'日期','价格':'收入','购买数量':'销量','成本':'产品成本','利润':'毛利'})


# 对某列的nan填充为0
result['广告费']=result['广告费'].fillna(0)

# 删除掉某列
result=result.drop(['毛利'],axis=1)
# 删掉某行
# df = df.drop(df[<some boolean condition>].index)


# 保存到CSV
DataFrame.to_csv(rootdir+"\\temp.csv", sep=',', na_rep='', index=False, encoding='utf-8')

# 直接保存到数据库
from sqlalchemy import create_engine
connect=create_engine("mysql+pymysql://root:password@localhost:3306/stocks_db?charset=utf8")
pd.io.sql.to_sql(data,"stock_basic",connect,schema='stocks_db',if_exists="replace")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值