如果你在学Python数据处理,一定对CSV文件不陌生。日常本地数据存储中,除了Excel文件外,大部分数据都是以CSV文件格式保存的。
CSV(Comma-Separated Values)是一种文本文件,也叫作逗号分隔值文件格式。顾名思义,它就是用来保存纯文本,被分隔符分隔为多个字段。
CSV文件能够被Excel、notepad++、Java、Python等各种软件读取,非常方便。
因为它结构简单、易传输、易读取的特性,使其广受个人和商业领域欢迎。
在Python中,可以使用read函数、pandas库、csv库等读写CSV文件,而且这些也是常用的方法。
这次给大家介绍一个非常强大的第三方库-csvkit,它是专门处理CSV文件的命令行工具,可以实现文件互转、数据处理、数据统计等,十分便捷。
因为csvkit是Python第三方库,我们直接使用pip来安装csvkit。
pip install csvkit
csvkit是命令行工具,所以代码都在命令行执行,下面列举一些常见的使用场景。
我们先在本地保存一个Excel表(DoubanMovie),其内容是豆瓣电影数据。