创建DataFrame对象
创建DataFrame对象的数据可以为列表,数组和字典
import pandas as pd
import numpy as np
a = [[1, 2, 3],[4, 5, 6]] #二维矩阵
df2 = pd.DataFrame(a, columns=[‘col1’,‘col2’,‘col3’], index=[‘a’,‘b’])
print df2
结果:
col1 col2 col3
a 1 2 3
b 4 5 6
读取
excel格式
data = pd.read_excel(‘四创-渠道.xlsx’,sheetname=‘单篇图文’)#sheetname指定sheet
保存成csv格式
不要index和header的保存
data_train.to_csv(‘temp/data_train.csv’,encoding=‘utf8’,index=False,header = False)
一、增
列连接(横向:变宽):merge
前提:header要一致
df1 = pd.DataFrame({‘key’: [‘a’, ‘b’, ‘c’], ‘data1’: [1, 2, 3]})
df2 = pd.DataFrame({‘key’: [‘a’, ‘b’, ‘c’], ‘data2’: [4, 5, 6]})
df3 = pd.merge(df1, df2)
结果:
df1:
key data1
0 a 1
1 b 2
2 c 3
df2:
key data2
0 a 4