一、导入外部数据
导入数据主要用到的是Pandas里的read_xO方法,x表示导入文件的格式。
1、导入.xlsx文件
在Excel中导入.xlsx格式的文件很简单,双击打开即可。在Python中导入.xlsx文件的方法是read_excel()。
2、基本导入
在导入文件时首先要指定文件路径,也就是这个文件在电脑中的哪个文件夹下存着。
import pandas as pd
df = pd.read_excel(r"C:\Users\Desktop\test.xlsx")
df
电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择路径前面加r。
3、指定导入哪个Sheet
.xlsx格式的文件可以有多个sheet,你可以通过设定sheet_name参数来指定要导入哪个sheet的文件。
除了可以指定具体Sheet的名字,还可以传入Sheet的顺序,从0开始计数。
如果不指定sheet_name参数时,那么默认导入的都是第一个sheet的文件。
4、指定行索引
将本地文件到DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。
index_col表示用.xlsx文件中的第几列做行索引,从0开始计数。
.