俗话说,巧妇难为无米之炊。不管你厨艺多好,如果没有食材,也做不出饭菜来,所以要想做出饭菜来,首先要买米买菜。而数据分析就 好比做饭,首先也应该是准备食材,即获取数据源。
一、导入外部数据
1、导入.xlsx文件
导入数据主要用到的是Pandas里的read_x()方法,x表示待导入文件的格式。
基本导入
在导入文件时首先要指定文件路径,也就是这个文件在电脑中的哪个文件夹下存着。
电脑中的文件路径默认使用\,这个时候需要在路径前面加一个 r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里 面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们 一般选择在路径前面加r。
指定导入哪个Sheet .xlsx格式的文件可以有多个Sheet,你可以通过设定sheet_name参数 来指定要导入哪个Sheet的文件。
除了可以指定具体Sheet的名字&#x