前面介绍过通过Python标准库中的CSV模块处理CSV文件:
Python 利用CSV模块处理数据
相比CSV模块,pandas的功能更加强大,本文将简单介绍如何通过pandas来处理CSV文件。
文章目录
一、pandas简介
pandas是一个第三方数据分析库,其集成了大量的数据分析工具,可以方便的处理和分析各类数据。这是一个第三方库,使用下面的命令可以安装pandas:
pip install pandas
利用pandas处理CSV文件主要分为3步:
- 通过read_csv()函数,将数据转化为pandas的DataFrame(数据帧)对象,这是一个二维数据对象,集成了大量数据处理方法。
- 操作DataFrame对象,通过自带的方法,完成各种数据处理。
- 通过DataFrame对象的to_csv()方法将数据写回CSV文件。
二、用法示例
我们先创建一个示例文件,将下面的数据拷贝到文件employees.csv中并保存:
emp_no,birth_date,first_name,last_name,gender,salary
1,1953-09-02,Georgi,Facello,M,1000
2,1964-06-02,Bezalel,Simmel,F,2000
3,1959-12-03,Parto,Bamford,M,3000
4,1954-05-01,Chirstian,Koblick,M,4000
5,1955-01-21,Kyoichi,Maliniak,M,5000
6,1953-04-20,Anneke,Preusig,F,6000
7,1957-05-23,Tzvetan,Zielinski,F,7000
8,1958-02-19,Saniya,Kalloufi,M,8000
9,1952-