pandas 如何把时间转成index_pandas基础教程

在这里,小编分享一些自己平时经常使用的pandas操作,如果能解决大家的问题那最好,如果不行那么多看看也是好的。多说无益下面上代码和例子:

数据选自选自kaggle的一个比赛。首先我们看看数据的基本情况:

56cf08f97f9eb82368b0b89934a8949a.png

数据内有整数型、浮点型、字符串

数据集切片:

1. iloc做切片处理df.iloc[:,xx]表示选择第xx列,df.iloc[xx,xx]表示选择第xx列xx行

1374082e2e934222877dcd9778e90b55.png

ac0e210964012494263a3d26709f7668.png

2.loc做切片基于列名

c4f861cc92d577361dc288cb943e9661.png

aede6084380b0f9136af72e07e37fb20.png

如果想根据行来切分呢?

42b57a10546ecc13bca7b14b2eed4755.png

fae7795e4a7d0e2225f9b517560c6c16.png

两个dataframe的合并或是切分,在这里我们先把这个dataframe一分为二:

f4c60a463d0a8ad43990dc8836b53082.png

注意df1的index,sample函数会打乱index的顺序,如果需要重置index,可以使用reset_index()函数:

8253be4fe0316652877179a23d144586.png

df的连接:

ddd52cd9422b9e2f307d6583624cb941.png

可以发现上下连接后,index是不会恢复原来的顺序的,因为他就是空间上的上下拼接。

下面看看左右拼接

66826e50ca2129ac0ee5dd55820d36ee.png

左右拼接时时要注意NaN也就是空值,他会按照index来填补空值。Pandas可以和mysql一样进行左连接和右连接以及内连接,具体是merge函数,这里不演示,大家有兴趣可以自己了解。

下面讲一讲groupby的用法。

1a97724cec957112f6c0bd4d448ac610.png

可以发现字符串类型是无法sum()的,pandas会自动识别。

通过reset_index()函数可以让列名回归你想要的格式

aa4be4c58b09509be8d00917fb4933bf.png

也可以多列进行groupby

871326265fc92c01f53d8c9db3974c97.png

可以指定列进行groupby后的操作

8a186d7807cf4771891497a411d97edb.png

也可以对不同列分别用不同的函数

39a62a30438e668f0c50a48bb71c0aff.png

Groupby后也可以使用apply函数,需要注意的是两者有区别

47d0cce8d1121f60e81f36c02cadd460.png

a64deeaa029772722bcec5687829a0dd.png

自定义函数apply()

98b58a257bb8cf868b2e3456b1783149.png

当然groupby还有很多妙用,小编这里举例的只是小编平时用的比较多的。

今天我们就先介绍到这里,下一期我们会重点介绍如何用groupby和时间数据结合,获取到1天内,一周内,一月内平均值,最大值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值