一、写在前面
本系列学习笔记参考书籍: 《数据分析实战》托马兹·卓巴斯,会将自己学习本书的笔记分享给大家,同样开成一个系列『数据分析从零开始实战』。
上一篇文章中带大家了解了数据分析基础,配置好了数据分析的基本环境,以及利用pandas
模块读写csv文件,在本文开头,我也补充了csv与tsv的基本介绍与区别,意在更好的让大家理解相关知识点,本文将带大家继续学习文件读取。
点击查看第一篇文章:数据分析 从零开始到实战,Pandas读写CSV数据
二、上节补充
CSV
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
TSV
TSV 是Tab-separated values的缩写,即制表符分隔值。 Python的csv模块准确的讲应该叫做dsv模块,因为它实际上是支持范式的分隔符分隔值文件(DSV,delimiter-separated values)的。
delimiter参数值默认为半角逗号,即默认将被处理文件视为CSV。
当`delimiter='\t'`时,被处理文件就是TSV。
复制代码
三、基本知识概要
1.利用pandas读