人生苦短，我用pandas一行代码读取4种常见文件

最新推荐文章于 2024-06-16 22:13:43 发布

python爬虫人工智能大数据

最新推荐文章于 2024-06-16 22:13:43 发布

阅读量2.5k

点赞数 1

一些好用的方法，也比较基础，pandas读取文件和数据库，保存文件和数据库，本节先讲读取文件（常见的Excel，csv，json，txt），后面会继续讲解读取数据库和保存文件数据库方面的知识点，所有例子都以最简单最基础的方法带大家入门

Excel文件：

640?wx_fmt=jpeg

csv文件：

640?wx_fmt=jpeg

txt文件：

640?wx_fmt=jpeg

json文件:json数据是{"key","value"}类型的数据，但是我们一般数据不止一条，所以文件处理成列表类型的，包含有很多json数据

640?wx_fmt=jpeg

全都是一行代码来读取，很简便，读取出来的数据是dataframe的二维数据结构，有行有列，跟源文件的数据结构一样，如果遇到编码问题，我们在读取的时候加参数encoding="utf-8"或者"gbk"等

导入的os模块，打印时候用了os.linesep，为了加个换行，这个方法适用于Windows和Linux操作系统

640?wx_fmt=jpeg

打印的数据：

640?wx_fmt=jpeg

当然，可能很多不是做数据分析的同学，读取到这个数据不会运用数据分析的方法处理这种数据结构，接下来给大家讲另外个方法，转换成我们常见的列表/字典结构，之后你就想怎么处理就怎么处理了,只用一个方法，to_dict即可，参数orient="records"，所有数据统一转换成我们可能想要的列表嵌套字典类型的数据,orient有6个参数可供选择，对应不同的数据结构，分别是‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’，下面简单举3个相对常见的例子，其他方法可以查阅相关文档，自己练习

orient = "records"，列表嵌套字典

640?wx_fmt=jpeg

orient = "dict" ,属于默认参数，可以不写直接to_dict()即可，字典嵌套字典

640?wx_fmt=jpeg

orient = "list"，字典里面包含列表

640?wx_fmt=jpeg

公众号回复：读取文件，即可领取文件和源码，帮助大家练习

公众号资源：

Python全套视频、Linux全套视频、爬虫全套视频、数据分析全套视频、python面试简历、python面试题，如有需要，欢迎公众号回复 1 ，添加微信获取，并可进入python学习群进行学习

python爬虫人工智能大数据公众号

640?wx_fmt=gif

python爬虫人工智能大数据

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
人生苦短，我用pandas一行代码读取4种常见文件

一些好用的方法，也比较基础，pandas读取文件和数据库，保存文件和数据库，本节先讲读取文件（常见的Excel，csv，json，txt），后面会继续讲解读取数据库和保存...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。