pandas笔记

读取csv文件,如果文件中无表头的话,则用header=None,否则,默认第一行为header,dtype可以指定某列在dataframe为str类型,以免转成dataframe时变成浮点数。

import pandas as pd
user_info=pd.read_csv('D:/predict_rujin/user_info.csv',header=None,dtype=str)

保存为csv文件:

df1.to_csv(path,header=True,index=False,encoding='UTF-8')

读取DataFrame的前几行或后几行,括号中也可以加入具体数字:

df1.head()
df1.tail()

更改dataframe的列名:

df1.columns=['column1','column2']

 

python中grouby和agg的操作: https://segmentfault.com/a/1190000012394176

                                                https://blog.csdn.net/claroja/article/details/71080293?utm_source=itdadao&utm_medium=referral

 

转换某列类型如:pd1.column.astype('str')

 

groupby后的列按照数组的形式看待。   

apply后面lambda函数的使用例子:对象.apply(lambda s:len(s.split(':'))) ,apply后面也可以自定义函数

t6.rename(columns={'distance':'merchant_max_distance'},inplace = True)

merchant3_feature = pd.merge(merchant3_feature,t2,on='merchant_id',how='left')

merchant3_feature.sales_use_coupon = merchant3_feature.sales_use_coupon.replace(np.nan,0) 

apply,applymap,map的区别

    apply 用在dataframe上,用于对row或者column进行计算;
  applymap 用于dataframe上,是元素级别的操作;
  map (其实是python自带的)用于series上,是元素级别的操作。
 

判断是否空值:

np.isnan(user_rujin_info_active).any()    #每一行是否有空
np.isnan(user_rujin_info_active)         #每一个数据是否为空
df1.fillna(0.5)         #填充空值

 np.unique(user_action_1.function_name)      #该列去重,去重后的该列保存在array中

dict(zip(function_name,range(len(function_name))))        

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值