一、前言
本篇博客主要讲解Pandas读取常用格式数据的方法
二、编辑器
- Jupyter Notebook
- 由于Jupyter Notebook 是交互式编辑器,所以在语法的表达上和在pycharm的语法表达上略有区别
三、数据集
(网上随便找的)
- excel文件:
- csv文件:
四、读取数据
1、read_csv
- 一般读取的是 txt、csv文件
- csv文件:一般是以英文逗号为数据分隔符
(1)读取数据
read_csv()函数:
报错:
文件的编码格式不对
改一下编码方式:
结果如下:
(2)保存数据
to_csv()函数:
(3)在同一个csv文件中追加保存数据
- mode:选择a (a是append的缩写),表示进行数据的追加
- header: 选择None,表示多次合并的数据只需要一行表头
- 第二次保存的数据会在第一次保存的基础上进行追加
若打开了要操作的文件,再运行代码,则会报错:
将文件关闭再运行代码即可解决。
2、read_excel
-
excel文件能打开的数据量一般是100多万条数据,超出该数据范围,用电脑打开文件时,超出的那部分数据不会再展示
-
csv文件允许展现的数据量会大一点
-
基本语法: read_excel(‘文件路径’)
(1)读取数据
read_excel()函数
结果:
(2)保存数据
to_excel()函数
(3)数据覆盖现象
保存的数据文件只有一个工作表,且工作表名字为“test2" ,因为直接调用,如果文件存在,则会覆盖原先的数据并重新写入数据:
(4)在一个excel中写入多个工作表(sheet)
创建实例化的文件路径——写入工作表——保存文件
结果:
(5)会话式保存多个sheet到一个excel中
结果: