索引我们一般定义为能唯一定义这条数据的一个标签
![17f085fa606c5f0c272a6dc3c1104dc5.png](https://img-blog.csdnimg.cn/img_convert/17f085fa606c5f0c272a6dc3c1104dc5.png)
和以前理解的数据库或者excel中的概念稍有不同,excel中的的索引概念并不是很大,更多的是我们主动去为它设置一个类索引的东西,比如1,2,3等等,来标记一条数据,数据库中倒是会自动为你设置一个编号,而在pandas中索引的作用却非常大,下面一起来学习下吧!
哪里需要索引
- pandas会自动为你设置一个索引,不管你愿不愿意
- 可以设置多级索引
- 数据筛选loc中需要index
为什么要设置索引
创建数据或者从外部导入数据后,如果索引不合适,或者需要设置多级索引的时候就需要设置索引
重要知识点:
- 设置索引有3中方式,直接传入一个列名作为索引,也可以添加一个成为多级索引,传入列表直接成为多级索引
- 如果需要修改原始数据就设置inplace
- 担心有重复就设置:verify_integrity
本文涵盖内容:
本文内容比较简单:
- 参数详解
- 索引的多种设置方式
- 参数的实例
pandas.DataFrame.set_index-参数详解
DataFrame.set_index(self, keys, drop=True, append=False, inplace=False, verify_integrity=False)[source]
使用现有列设置DataFrame索引。
使用一个或多个现有列或数组(长度正确)设置DataFrame索引(行标签)。 索引可以替换现有索引或对其进行扩展。
以上为官方的解释,其实主要功能还是利用现在的列来当做或者扩充索引,扩充就成为多级索引&