首先dataframe是一种数据结构,类似于excel的一种表格,如下图
然后我们创建一个吧
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
...: 'B': ['B0', 'B1', 'B2', 'B3'],
...: 'C': ['C0', 'C1', 'C2', 'C3'],
...: 'D': ['D0', 'D1', 'D2', 'D3']},
...: index=[0, 1, 2, 3])
是酱子的
再来我们创建个简单的
df1 = pd.DataFrame({'A':'A0','B':'B0'})
会报错
ValueError: If using all scalar values, you must pass an index
是因为如果你提供的是一个标量,必须还得提供一个索引Index,所以这么写
df2 = pd.DataFrame({'A':'A0','B':'B0'},pd.Index(range(1)))
df2
输出看看
再来 假如我只想建立A C列怎么办?
df3 = pd.DataFrame(data={'A': ['A0', 'A1', 'A2', 'A3'],
...: 'B': ['B0', 'B1', 'B2', 'B3'],
...: 'C': ['C0', 'C1', 'C2', 'C3'],
...: 'D': ['D0', 'D1', 'D2', 'D3']},columns=['A','C'])
再来 两个表怎么连接
df4=pd.DataFrame(data={'A': ['A0', 'A1', 'A2', 'A3'],
...: 'B': ['B0', 'B1', 'B2', 'B3']})
df5=pd.DataFrame(data={ 'C': ['C0', 'C1', 'C2', 'C3'],
...: 'D': ['D0', 'D1', 'D2', 'D3']})
先看看这两表
接下来拼起来
fram=[df4,df5]
df6=pd.concat(fram,axis=1) #axis=1横着拼 axis=0竖着拼
输出看看