python总结2——dataframe

一、Numpy

1.1创建矩阵

import numpy as np 
a = np.array([1,2,3])  //一维
a = np.array([[1,  2],  [3,  4]])  //二维

#创建指定大小的数组,数组元素以 0 来填充
numpy.zeros(shape, dtype = float, order = 'C')

#创建指定形状的数组,数组元素以 1 来填充
numpy.ones(shape, dtype = None, order = 'C')

#随机数组
np.random.random(size=)

1.2矩阵类型

np.dtype(np.int32)
# int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
dt = np.dtype('i4')

1.3 numpy对象属性

请添加图片描述

1.4 索引

https://www.runoob.com/numpy/numpy-advanced-indexing.html

二、Pandas:Dataframe

pd.Dataframe(,columns=['','',''])

# 修改数据类型
dataset_copy['User_id'] = list(map(int,dataset_copy['User_id']))

#Coupon_id空值填0,表示无优惠券消费
dataset_copy['Coupon_id'].fillna(0,inplace=True)

#Date/Date_received变成日期格式
dataset_copy['date_received']=pd.to_datetime(dataset_copy['Date_received'],format='%Y%m%d')    

 # 用户在预测月领取优惠券的次数
    keys = ['User_id']
    t_ds=feature_ds[feature_ds['Date_received']!=0]
    #以keys为键,'cnt'为值,使用len统计出现的次数
    t_ds=pd.pivot_table(t_ds, index=keys, values='cnt', aggfunc=len)
    //aggfunc={'discount_rate':[min, max, np.mean,np.median]}
    #keys会成为index,统计出的特征列会以values即'cnt'命名,将其改名
    t_ds=pd.DataFrame(t_ds).rename(columns={'cnt':'o1'})
    #将index还原 
    t_ds=t_ds.reset_index()
    #合并
    label_field=pd.merge(label_field,t_ds, on=keys, how='left')
    #填空
    label_field['o1'].fillna(0,downcast='infer',inplace=True)

三、Pandas:Plot

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值