pandas包常见使用整理

常用功能一、读入CSV  

        data = pd.read_csv('C:\\Users\\路径.csv')

        如果涉及中文标题,加入参数: data = pd.read_csv('C:\\Users\\路径.csv',encoding='GBK')

 

常用功能二、获取行名、列名、行数、列数

data.dtypes     # 查看dataframe 的数据类型

data.columns   # 列名列表

data.shape    获取行列,返回数组,可以在后面加[0] 行  [1] 列

dfname._stat_axis.values.tolist() # 行名称
 
dfname.columns.values.tolist()    # 列名称
 

常用功能三、重命名

        暴力重命名所有列   data.columns = ['A','B']   按照顺序重新命名所有列     

        data.rename(columns={'A':'a', 'B':'b', 'C':'c', 'D':'d'}, inplace = True)   这种方式可以任意更改自己想修改的列明,且不用注意顺序。

 

常用功能四、新增列、删除行

       data['e']  = data['d']- 1      新增列并赋值

        data.drop['2']                  删除索引为2的行

 

常用功能五、筛选

      a. 筛选行列 :   df.at、 df.ix、df.loc、df.iloc等用法

        df['a']

         df.ix  可以用数字也可以用列明来筛选 如: data.ix[1,1]   data.ix["a","B"]

         df.loc 只能用行名和列名来筛选  data.loc["b","B"]    data.loc['b':'c','B','C']

         df.iloc 只能用数字 data.loc[1,1]

         df.at     可以支持数字行序和列名的混合使用: data[1,'a']   可支持变量序号 如:  for i in range(0,100):    print(data.at[i,'shop_name'])

    b. 筛选空值、等于某值:

        单条件: df[df.D>0]

        多条件:  df[(df.D>0)&(df.C<0)]

        包含多值: df.A.isin([‘重庆’,’成都’])
 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值