针对不同文件类型有不同的数据导入方法
待导入文件类型 | 导入方法 |
---|---|
csv | pandas.read_csv |
txt | pandas.read_table |
xls | pandas.read_excel |
下面是代码示例
- 导入csv类型数据文件
# 导入csv类型数据文件
from pandas import read_csv
df=read_csv('D:\\tmp\\1.csv') # 需要转义 要用双斜杠
df
- 导入txt类型数据文件
# 导入txt类型数据文件
from pandas import read_table
df=read_table('D:\\tmp\\2.txt',names=['age','name'],sep=',') # 导入的文件,若不指定列头,会把第一行数据默认为列头,若不指定分隔符,会默认一行数据都是第一列的数据,其他都是NaN
df
3.导入xls类型数据文件
# 导入xls类型数据文件
from pandas import read_excel
df=read_excel('D:\\tmp\\3.xls',sheet_name='data') # 指定sheet页名称
df
PS:中文路径的话,需要同时指定 encoding=‘UTF-8’,engine=‘python’
# 中文路径的话,需要同时指定 encoding='UTF-8',engine='python'
df=read_table('D:\\tmp\\中文.txt',sep=',',encoding='UTF-8',engine='python')
df