说明:以练习题的方式,学习python基础知识点,主要是数据分析方向常用的numpy、pandas、matplotlib等库对应的练习题。仅供参考,题目来源于网络,如有侵权请联系我删除。
Pandas中的层次化索引、数据转置、数据分组及运算、离散化处理等:
(1)读取数据。读取之前作业保存的“酒店数据1.xlsx”
import numpy as np
import pandas as pd
data = pd.read_excel('酒店数据1.xlsx')
data.head()
(2)将“类型”和“名字”设置为层次化索引,并交换索引的位置。然后将层次化索引取消。
答:层次化索引,是指在一个轴上拥有多个索引。
Series的层次化索引(index),DataFrame的层次化索引(index,columns)。
本题中是将列名变为层次索引,采用set_index(),取消用reset_index()方法。也可以直接生成。
#DataFrame设置层次化索引
data = data.set_index(['类型','名字'])
#交换索引位置swaplevel()
data.swaplevel('名字','类型')
#取消索引
data = data.reset_index()