1.pandas简介
Pandas 的数据结构主要是:Series(一维数组),DataFrame(二维数组)。
2.series
Series可以自定义标签(索引),然后通过索引来访问数据。
Series拥有8个常用属性,如下所示。
values:以ndarray的格式返回Series对象的所有元素
index:返回Series对象的索引
dtype:返回Series对象的数据类型
shape:返回Series对象的形状
nbytes:返回Series对象的字节数
ndim:返回Series对象的维度
size:返回Series对象的个数
T:返回Series对象的转置
from pandas import Series
'''
创建Series对象
如果使用索引,则默认索引是【0~len(数据)-1】
'''
s1=Series([1,2,3,4,5])
s2=Series([1,2,3,4,5],index=['a','b','c','d','e'])
print(s1)
#获取索引
print(s1.index)
# 获取值
print(s1.values)
# 获取索引和值
# 取指定值
print(s2[0])
print(s2['a'])
from pandas import Series
s1=Series([1,2,3,4,5])
s2=Series([1,2,3,4,5],index=['a','b','c','d','e'])
# 连续取值
print(s2[1:3])
print(s2['b':'c']
3.DataFrame
DataFrame是由索引和内容组成,索引既有行索引index又有列索引columns,如 内容,index=[ ],colunms=[ ] 这样的形式。
连接如下
3.1创建DataFrame
1.创建空的DataFrame
import pandas as pd
df=pd.DataFrame()
print(df)
2.使用list创建DataFrame
import pandas as pd
list1=[0,1,2,3,4]
list2=['apple','banana','orange','pen','cat']
df=pd.DataFrame(list2,list1)
print(df)
3.使用字典创建DataFrame
import pandas as pd
dict={'num':[0,1,2,3,4],'value':['a','b','c','d','e']}
dict_df=pd.DataFrame(dict)
dict_df
4.使用带数字的索引创建DataFrame
import pandas as pd
dict={'num':[0,1,2,3,4],'value':['a','b','c','d','e']}
index=[]
for i in range(1,len(dict['value'])+1):
index.append(i)
df=pd.DataFrame(dict,index=index)
df
5.从字典列表创建DataFrame
import pandas as pd
data=[{'one':'a','two':'b','three':'c'},{'one':1,'two':2,'three':3}]
df=pd.DataFrame(data)
df