从零开始学Python连载【六】--pandas(数据框部分02)
珂珂带你学编程 2020-04-27 10:39:52
接着上一期的pandas模块介绍与应用,今天我们来聊聊如何借助于pandas模块进行数据的预处理,内容包括数据集变量与观测的筛选、变量的重命名、数据类型的变换、排序、重复观测的删除、和数据集的抽样。一、数据筛选
以iris数据集为例,想从数据集中取出某列(序列对象)或某几列该如何操作?
![728320d1b9a178efb446007654c8265c.png](https://i-blog.csdnimg.cn/blog_migrate/c8610559f2a9659ab1bfcce0d9007f60.jpeg)
在pandas取出一列有两种方法,一种是比较普遍适用的名称索引法,另一种则是点取法。看看下面的例子就可以理解了:
![71a41ff374f22d2ccbac44de5f0e82fa.png](https://i-blog.csdnimg.cn/blog_migrate/9242fa2862d83b8bb1683a4f28c5f426.jpeg)
如果使用点取法取出数据集中的某列,需要注意的是列的名称必须是一个整体,例如stu age或stu.age等格式的变量名就不能使用点取法。
对应到R语言中,也有两种取列的方法,分别是索引法和$取法: