1.DataFrame创建
pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
data:numpy ndarray(结构化或同类),dict或DataFrame,Dict可以包含Series,数组,常量或类似列表的对象
index:dataframe的索引,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)
columns:dataframe的列标签,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)
dtype:默认None,要强制的数据类型。 只允许一个dtype
copy:boolean,默认为False
# 从np.array 转换为 pd.DataFrame
data = np.array([['','Col1','Col2'],
['Row1',1,2],
['Row2',3,4]])
pd.DataFrame(data=data[1:,1:],
index=data[1:,0],
columns=data[0,1:])
# Col1 Col2
# Row1 1 2
# Row2 3 4
# 直接采用字典做参数
my_dict = {1: ['1', '3'], 2: ['1', '2'], 3: ['2', '4']}
print(pd.DataFrame(my_dict))
# 1 2 3
# 0 1 1 2
# 1 3 2 4
# 用一个DataFrame做输入参数
my_df = pd.DataFrame(data=[4,5,6,7], index=range(0,4), columns=['A'])
print(pd.DataFrame(my_df))
# A
# 0 4
# 1 5
# 2 6
# 3 7
# 输入一个Series
my_series = pd.Series({"United Kingdom":"London", "India":"New Delhi", "United States":"Washington", "Belgium":"Brussels"})
print(pd.DataFrame(my_series))
# 0
# Belgium Brussels
# India New Delhi
# United Kingdom London
# United States Washington
需要注意,以字典的方式创建,字典的键当做DataFrame的列名,当每个键对应的value值的个数为1时,必须输入index;以Series的方式创建,Series的索引是DataFrame的索引。