csv 0开头_使用Pandas进行数据处理,CSV、Excel文件载入和导出操作

导读

数据导入是数据处理、分析的第一步,Pandas提供非常多的方法,对不同格式、不同来源的数据进行导入和导出操作。

4d51c901ccdd87cdd918d517d72759ed.png

Pandas对以下数据源导入/导出方法列表:

a2d8d45731d2641d03d56058bfb4c89d.png

Pandas还有很多数据导入/导出方法,不是特别常用,就没有列举

比较常用的

  • 对CSV文件的读写:read_csvo_csv
  • 对excel文件的读写:read_excelo_excel

Pandas数据导入方法参数比较多,容错性,识别能力较好

  • 支持类型推断和数据转换
  • 支持用户自定义的值转换,自定义的缺失值
  • 支持时间日期识别,自动解析
  • 支持对大型文件的分块迭代
  • 清理数据功能:跳过行、页脚、注释以及其他次要数据
  • 识别数字千位符号

使用read_csv/to_csv方法,对csv格式数据文件进行导入/导出操作

  • pd.read_csv方法,数据导入
e718f5b84c1165889ddf6db528e0c0ac.png

read_csv方法一些参数说明:

  1. path 文件路径
  2. sep/delimiter 指定分隔符
  3. header 指定哪行作为列名,默认为0,如果文件中没有列名,可设置为None
  4. index_col 指定那列作为行索引的列编号或者列名
  5. names 指定列名列表
  6. skiprows 忽略跳过的行数、行号列表
  7. na_values 替代缺失值的列表
  8. comment 在行结尾处分隔注释的字符
  9. parse_dates 尝试将数据解析为datetime,默认是False,如果是True,将尝试解析所有列,也可以指定列号列名列表进行解析
  10. converters 列名称跟函数映射的字典
  11. dayfirst 解析费明确日期时,按照国际格式处理,默认是False
  12. date_parser 指定用于解析日期的函数
  13. nrows 从文件开头处读入的行数
  14. skip_footer 忽略文件尾部的行数
  15. encoding 指定文件编码
  16. thousands 指定千分位分隔符
  • pd.to_csv方法,数据导出
95b817f840f8dc8a469dcf55c0790858.png

参数说明:

  1. 指定输出文件名
  2. sep:用’,’分隔
  3. header:是否带头部信息
  4. index:是否带行号

使用read_excel/to_excel方法,对Excel文件进行导入/导出操作

c20743da9a215fc25b795da25a5519a4.png

最后

如果内容有误,欢迎评论区指正!

喜欢我的朋友们,麻烦点一波关注,谢谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值