Series与DataFrame
# 从excel读取数据
df = pd.read_excel(input_path + "某表.xlsx")
# 写入excel,参数意义很明显了
df.to_excel(out_file, sheet_name='data', header=True, index=False, encoding='utf_8_sig')
# 从数据库读取数据
def get_db_data(con, sql):
# 数据库连接字符串:con = 'oracle://<username>:<password>@IP:Port/SID'
con = create_engine(con)
# 这里是为了更好地支持中文
os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE _CHINA.UTF8'
# 取数据一句话搞定
df = pd.read_sql(sql, con)
return df
# 创建空DataFrame
df_empty = pd.DataFrame(columns=())
或者
df_empty = pd.DataFrame(columns=['A', 'B', 'C', 'D'])
# 逐行添加数据df_empty = df_empty.append([{'A': va, 'B': vb, 'C': vc, 'D': vd}], ignore_index=True)
或者
df_empty = df_empty.append(pd.DataFrame({'A': [va], 'B': [vb], 'C': [vc], 'D': [vd]}), ignore_index=True)
# 替换表头
df.columns = ['a', 'b', 'c']
# 选取满足特定条件的某列
df = df[df['a'].isin(['a1', 'a2'])]