import pandas as pd
数据结构和数据分析
两种数据结构:
Series
索引值可以重复(自定义)
DataFrame
一组有序的列,每列可以是不同的值类型(数值、字符、布尔等)
读excle文件
# data1 = pd.read_excel('C:\\Users\\Administrator\\Desktop\\remmand.xlsx')
# data = data1.values
# data = data.T
Series
构建出来为一列数
创建序列
s=pd.Series(data,index,dtype,copy)
data的数据类型:
列表: data=[1,2,3,4]
a=pd.Series([1,2,3],index=['a','b','c'],dtype='int',name='something')
一维数组: data=np.array([1,2,3,4])
d=pd.Series(np.array([1,2,3]),dtype='int',name='something')
标量: data=5
b=pd.Series(5,index=['a','b','c'],dtype='int',name='something')
字典型(字典的键用于构建索引): data={'a'