Pandas 使用行索引和列标签表达和分析数据,分别对应 axis=0, axis=1,行索引、列标签带来一些便捷的功能。那么如何利用Pandas实现行对齐和列对齐?今天番茄加速就来讲一下。
如果玩Pandas,还没有注意到对齐 alignment,这个特性,那该好好看看接下来的分析。
基于行索引的对齐,与基于列标签的对齐,原理是一致的,它们其实相当于字典的 key,起到对齐数据作用。但是,这种说法抽象了些,没有例子不好想象出对齐的作用。
下面使用google app store 重点分析“行对齐”功能,理解它后,列对齐也自然理解。
导入包:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
版本号:
print(pd.version)
print(np.version)
print(sns.version)
1.0.1
1.18.1
0.11.0
导入数据:
df = pd.read_csv(‘kaggle-data/googleplaystore.csv’)
df.head(3)
图片
剔除一些异常数据后得到 df_normalÿ