人生苦短,我用pandas一行代码读取4种常见文件

一些好用的方法,也比较基础,pandas读取文件和数据库,保存文件和数据库,本节先讲读取文件(常见的Excel,csv,json,txt),后面会继续讲解读取数据库和保存文件数据库方面的知识点,所有例子都以最简单最基础的方法带大家入门


Excel文件:

640?wx_fmt=jpeg


csv文件:


640?wx_fmt=jpeg


txt文件:

640?wx_fmt=jpeg


json文件:json数据是{"key","value"}类型的数据,但是我们一般数据不止一条,所以文件处理成列表类型的,包含有很多json数据


640?wx_fmt=jpeg


全都是一行代码来读取,很简便,读取出来的数据是dataframe的二维数据结构,有行有列,跟源文件的数据结构一样,如果遇到编码问题,我们在读取的时候加参数encoding="utf-8"或者"gbk"等


导入的os模块,打印时候用了os.linesep,为了加个换行,这个方法适用于Windows和Linux操作系统


640?wx_fmt=jpeg


打印的数据:


640?wx_fmt=jpeg


当然,可能很多不是做数据分析的同学,读取到这个数据不会运用数据分析的方法处理这种数据结构,接下来给大家讲另外个方法,转换成我们常见的列表/字典结构,之后你就想怎么处理就怎么处理了,只用一个方法,to_dict即可,参数orient="records",所有数据统一转换成我们可能想要的列表嵌套字典类型的数据,orient有6个参数可供选择,对应不同的数据结构,分别是‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’,下面简单举3个相对常见的例子,其他方法可以查阅相关文档,自己练习


orient = "records",列表嵌套字典

640?wx_fmt=jpeg


orient = "dict" ,属于默认参数,可以不写直接to_dict()即可,字典嵌套字典

640?wx_fmt=jpeg


orient = "list",字典里面包含列表

640?wx_fmt=jpeg


公众号回复:读取文件,即可领取文件和源码,帮助大家练习


公众号资源:

Python全套视频、Linux全套视频、爬虫全套视频、数据分析全套视频、python面试简历、python面试题,如有需要,欢迎公众号回复 1 ,添加微信获取,并可进入python学习群进行学习


python爬虫人工智能大数据公众号

640?wx_fmt=gif

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值