目录
DataFrame
一种二维表格的数据结构,可以用于存储数值型数据和文本数据,且可以对存储的数据进行高性能的运算和处理,且可以和数据库进行关联。
Series结构
是一种一维的存储数据的结构,单行或单列结构,是组成DataFrame的基本结构,二维的DataFrame中的单行和单列其实就是Series.
series组成(两部分)
values:一组数据,index:相关的数据索引标签
隐式索引:默认索引,数值型,显示索引:自定义,字符串
创建方式:
import numpy as np
import pandas as pd
#默认索引
s1 = pd.Series(data=[1,'two',3])
print(s1)
#显示索引
dic = {
'英语':100,
'数学':120,
'理综':300
}
s2 = pd.Series(data=dic)
#自定义显示索引
s3 = pd.Series(data=[1,2,3],index=['a','b','c'])
print(s3)
Dataframe组成
创建方式:
添加表结构:多级列表方式写入
import numpy as np
import pandas as pd
from pandas import DataFrame,Series#创建df:使用的默认的索引
df1 = DataFrame(data=[[1,2,3],[4,5,6]])
#通过numpy随机生成的数据填充df
df2 = DataFrame(data=np.random.randint(0,100,size=(5,6)))#自定义索引
df3 = DataFrame(data=[[1,2,3],[4,5,6]],index=['a','b'],columns=['A','B','C'])
print(df3)# #删除指定列
# df.drop(labels='Unnamed: 0',axis=1,inplace=True)