喜欢就先点个关注吧。
在使用Python进行数据分析时,我们会不时对DataFrame中的元素进行选取,以便完成后续的操作。DF中的选取操作不少,今天我们来讲一些主要的方法。
一、类比列表的索引形式
在这之前,我们先创建了一个DF:
我们把上述DF当做列表,每一行则是列表的一个元素,那么我们就可以通过如下方法来选取第0行到第2行的数据(区间是左闭右开,和列表一样):
需要指出的是,这种方法只认上述的连续多个元素的切片,不认如df[2]这样的单个元素或df[[0, 2]]这样的多个非连续元素的索引。
二、类比字典的索引形式
如果我们把DF看做是若干个纵向Series的容器,每个Series对应的列名当做字典的键,每个Series当做是字典的值,那么接下来的操作就非常容易理解了。
我们先直接通过单个键来索引值,即选取单列:
也可以通过传递列表的形式来索引多个不同的列:
另外,字典的get方法也可以使用:
是不是很神奇?当然,主要是因为大神在写pandas库的时候,其实是很积极的去借鉴了ndarray、列表和字典等等这些数据结构的。
由于年底繁忙,今天的Python数据分析的分享先到这,我们下一期接着分享用.loc[]和.iloc[]等方法进行DF元素选取的内容,预计会在两天之内吧,感兴趣的朋友可以留意一下。