python数据导出为csv文件
1 介绍
将 list 或 numpy.narray 类型的数据导出为csv文件(同理可扩展到导出为excel,即写入的文件格式为xls,且最后使用to_excel()方法)
2 包及相关方法
pandas
- DataFrame()
- join()
- to_csv() / to_excel()
3 代码
import pandas as pd
def dataToCsv(file, data, columns, target):
data = list(data)
columns = list(columns)
file_data = pd.DataFrame(data, index=range(len(data)), columns=columns)
file_target = pd.DataFrame(target, index=range(len(data)), columns=['target'])
file_all = file_data.join(file_target, how='outer')
file_all.to_csv(file)
4 说明
输入:
- file:文件对象
- data:数据集的数据部分
- columns:数据集的特征名称
- target:数据集的结果
5 相关方法
- pandas.DataFrame
- 类似于数据库表结构的数据结构,其含有行索引和列索引
- 构建方法:DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
- data:numpy.narray,dict(包括系列,数组等),DataFrame
- index:索引或数组类
- columns:索引或数组类,作为列标签
- dtype:数据类型
- copy:复制,复制数据的输入
- pandas.DataFrame.join()
- dataframe内置的快速合并的方法
- join(other, on=None, how=‘left’, lsuffix=’’, rsuffix=’’, sort=False)
- other:合并的列dataframe
- on:列名,如果右表的索引值正是左表的某一列的值,这时可以通过将 右表的索引 和 左表的列 对齐合并
- how:数据融合的方法, {‘left’, ‘right’, ‘outer’, ‘inner’},默认 ‘left’
- Isuffix:列名重复时,左表的列名添加的后缀名称
- rsuffix:列名重复时,右表的列名添加的后缀名称
- sort:是否根据合并的key进行排序
- pandas.DataFrame.to_csv()
- path_or_buf:文件路径或文件对象
- sep:分隔符,默认‘,’
- na_rep:替换空值,默认空
- float_format:格式
- cols:是否保留某列数据,默认空
- header:是否保留列名,默认保留
- index:是否保留索引,默认保留