Dataframe是pandas中的数据结构,可以认为是一个表格数据
import pandas as pd #导入pandas包
df=pd.read_excel(r"C:\Users\Administrator\Desktop\测试.xlsx") #将文件的路径放入函数里面即可
print(df) #打印对象
1.每列可以是不同的值类型(数值、字符串、布尔值、日期等)
2.既有行索引index(上图中的0),也有列索引columns(上图中的“第一列”,“第二列”)
3.可以被看做由数组(列表)组成的字典,例如: {“第一列”:[1],"第二列“:[2]}
如何创建Dataframe?
import pandas as pd
data={
'第一列':['Ohio','Ohio','Ohio','Nevada','Nevada'],
'第二列':[2000,2001,2002,2001,2002],
'第三列':[1.5,1.7,3.6,2.4,2.9]
}
df = pd.DataFrame(data)
怎样查看Dataframe数据类型?
print(df.dtypes)
第一列 object #字符类型
第二列 int64 # 整型
第三列 float64 #浮点型
dtype: object
什么是Series?
Series可以认为是pandas中的一行,或者是一列,也就是说一个数组。
print(df["第一列"]) #取一列数据
print(df.iloc[0]) #取一行数据
怎样获取列索引(列头)以及行索引?
print(df.columns) #获取列索引
print(df.index) #获取行索引