一些好用的方法,也比较基础,pandas读取文件和数据库,保存文件和数据库,本节先讲读取文件(常见的Excel,csv,json,txt),后面会继续讲解读取数据库和保存文件数据库方面的知识点,所有例子都以最简单最基础的方法带大家入门
Excel文件:
csv文件:
txt文件:
json文件:json数据是{"key","value"}类型的数据,但是我们一般数据不止一条,所以文件处理成列表类型的,包含有很多json数据
全都是一行代码来读取,很简便,读取出来的数据是dataframe的二维数据结构,有行有列,跟源文件的数据结构一样,如果遇到编码问题,我们在读取的时候加参数encoding="utf-8"或者"gbk"等
导入的os模块,打印时候用了os.linesep,为了加个换行,这个方法适用于Windows和Linux操作系统
打印的数据:
当然,可能很多不是做数据分析的同学,读取到这个数据不会运用数据分析的方法处理这种数据结构,接下来给大家讲另外个方法,转换成我们常见的列表/字典结构,之后你就想怎么处理就怎么处理了,只用一个方法,to_dict即可,参数orient="records",所有数据统一转换成我们可能想要的列表嵌套字典类型的数据,orient有6个参数可供选择,对应不同的数据结构,分别是‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’,下面简单举3个相对常见的例子,其他方法可以查阅相关文档,自己练习
orient = "records",列表嵌套字典
orient = "dict" ,属于默认参数,可以不写直接to_dict()即可,字典嵌套字典
orient = "list",字典里面包含列表
公众号回复:读取文件,即可领取文件和源码,帮助大家练习
公众号资源:
Python全套视频、Linux全套视频、爬虫全套视频、数据分析全套视频、python面试简历、python面试题,如有需要,欢迎公众号回复 1 ,添加微信获取,并可进入python学习群进行学习
python爬虫人工智能大数据公众号