数据处理不常用语句3

###########################时间序列#################################
data_bs.index = pd.date_range
(start='2018-08-01 00:00:00',periods=744,freq='h',normalize=True)

#######################################################################
sales_train_v2.isna().sum()#显示空值
sales_train_v2.select_dtypes(include = ['float'])#选择属性为float的数据



#plot显示
#3D显示
from mpl_toolkits.mplot3d import Axes3D
*******************************************************************************
#数据类型转换、编码
pd.get_dummies/factorize前者将标称型数据变为一组数字的矩阵,后者将标称型数据变为一列数据

#计算元素出现的次数
list: counts.counter()
numpy: np.unique(data, return_counts = True)
pandas: data.value_counts()
*********************************************************************************

np.argsort()

np.product(data.shape))#product表示笛卡尔积,data.shape(2,18),表示2*18 = 36

np.var()#方差

np.cumsum

errorbar

figure(figsize(6,6))

***********************************************************************************
dataframe.sample(5)#随机显示5个样本(dataframe.head()#前10个样本)


data.fillna(method = 'bfill', axis=0).fillna(0)#缺失值填充,根据后一个值进行填充,不存在就填0
pad/ffill:用前一个非缺失值去填充该缺失值
backfill/bfill:用下一个非缺失值填充该缺失值

#########################################################################################
train.groupby(['Pclass', 'Survived'])['Survived'].count()
train[['Pclass', 'Survived']].groupby('Pclass').mean().plot.bar()
#isnull(), notnull()
agedf_train = agedf[agedf.Age.notnull()]
agedf_test = agedf[agedf.Age.isnull()].drop('Age',axis = 1)

处理进程时间tqdm:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Great1414

整理不易,谢谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值