1.Pandas的基本数据结构 -- DataFrame
- DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的;
- DataFrame既有行索引,也有列索引,它可以看作是由Series组成的字典,不过这些Series公用一个索引;
- DataFrame的创建有多种方式,不过最重要的还是根据Series/字典进行创建,以及读取csv或者txt文件来创建。
2.创建DataFrame
import pandas as pd
import numpy as np
df = pd.DataFrame(data=np.array([i for i in range(1,10)]).reshape((3,3)),index=['a','b','c'],columns=['num','age','score'])
- 其中data是df的值,类型为array;
- index为df的行索引;
- columns为列明即列索引。
通过拼接Series创建:
import pandas as pd
import random
ser_age = pd.Series(data=random.sample(range(1,100),10),index=range(0,10),name='age')
ser_name = pd.Series(data=dict(zip(range(0,