Python获取外部数据--学习笔记
获取常见.csv、.txt、.xlsx文件用例
.csv文件
import pandas as pddf = pd.read_table (r"E:\网元报表_2020-05-25_09-03-47_1.csv")df
import pandas as pddf = pd.read_table (r"E:\网元报表_2020-05-25_09-03-47_1.csv",sep = "\t")df
.txt文件
import pandas as pddf = pd.read_table('E:/test.txt',header=None,encoding='gb2312',delim_whitespace=True,index_col=0)df
import pandas as pddf = pd.read_table(r'D:\python\test.txt',header=None,encoding='gb2312',delim_whitespace=True,index_col=0,usecols = [0,1,2,3,4,8,9,10])df
.xlsx文件
import pandas as pddf = pd.read_excel (r"E:/table1.xlsx")df
import pandas as pddf = pd.read_excel ("E:/table1.xlsx")df
import pandas as pddf = pd.read_excel (r"D:/python/table1.xlsx",usecols = [0,1,2,3])df
可以通过help(pd.read_excel)查看帮助文档
python处理数据文件第一步是要读取数据,文件类型主要包括文本文件(csv、txt等)、excel文件、数据库文件
python内置了csv模块用于读写csv文件,csv是一种逗号分隔符文件,是数据科学中最常见的数据存储格式之一。csv模块能轻松完成各种体量数据的读写操作,当然大数据量需要代码层面的优化
read_csv方法read_csv方法用来读取csv格式文件,输出dataframe格式
read_excel方法
读取excel文件,包括xlsx、xls、xlsm格式
read_table方法
通过对sep参数(分隔符)的控制来对任何文本文件读取