介绍
pandas是用于数据分析的Python库,用来处理电子表格数据,并具备可视化与可再现性特点。
整个电子表格在pandas中使用dataframe结构进行表达。每个dataframe可以看作是由多个列组成,这个列在dataframe中称为serie。每个列都有列名,也有行名,只是通常情况下没指定行名。每个行都有自己的行号,行号是从0开始的。如果没有指定行名,则将行号添入行名。行号是隐形索引。每个表格还有大小shape,返回行数与列数。
加载数据
在处理数据首先要加载数据,从各种数据文件中将数据读入dataframe结构,才能使用pandas进行后续处理。加载数据同样需要pandas库。
import pandas (as pd)
导入时可指定别名,方便记忆与书写。
df= pandas(pd)