import numpy as np
import pandas as pd
"""
本节介绍pandas中的dataframe和series两种数据结构
"""
# 创建没有标签索引的series
series_1 = pd.Series([1, 2, 3, 'a'])
# print(series_s)
# 获取索引
series_index = series_1.index
# 获取数据
series_values = series_1.values
# 创建有标签索引的series
series_2 = pd.Series(data=['1',2,3],index=[1,3,'q'])
#print(series_2)
# 使用python字典创建series
dict_1 = {'a':1,'b':2}
series_3 = pd.Series(dict_1)
# 查询数据
s1 = series_3['a']
s2 = series_3[['a','b']] # 查询多个是两个中括号
#print(s2)
#print(type(s2))
# 创建dataframe
data = {
'a':[1,2,3],
'b':[4,5,6],
'c':['w','r',3]
}
dataframe_1 = pd.DataFrame(data)
print(dataframe_1)
# 查询列,从dataframe中查询出series
d_s1 = dataframe_1['a'] # 单列就是一个series
d_s2 = dataframe_1[['a','b']] # 多列就是一个dataframe
# 查询行
d_s3 = dataframe_1.loc[1] # 这代表是查行索引为1的那一行,单行还是一个series
d_s4 = dataframe_1.loc[1:3] # 这里需要注意,loc查询的是1,2,3共三行,iloc查询的就是1,2共两行,返回的是一个dataframe(loc)
Pandas中的Dataframe和Series两种数据结构_2
最新推荐文章于 2024-10-08 12:37:10 发布