前言
python中DataFrame是我们进行数据分析和建模过程中使用度最频繁的
1.构建DataFrame
pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
data:numpy ndarray(结构化或同类),dict或DataFrame,Dict可以包含Series,数组,常量或类似列表的对象
index:dataframe的索引,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)
columns:dataframe的列标签,如果没有自定义,则默认为RangeIndex(0,1,2,…,n)
dtype:默认None,要强制的数据类型。 只允许一个dtype
copy:boolean,默认为False
Pandas主要有两种重要的数据结构:Series和DataFrame.
- Series: 类似一个一维数组,一个Series对应DataFrame的一列
- DataFrame:类似一个二维数组,一个DataFrame由几个Series列构成。
import numpy as np
import pandas as pd
ser = pd.Series(np.arange(3.))
# ser
0 0.0
1 1.0
2 2.0
dtype: float64
print('---