xls——pandas + xlrd两个外部函数库
xlsx——pandas + openpyxl两个外部函数库
xls格式的文件:
首先需要Win+R,输入cmd打开命令行,然后pip install pandas和pip install xlrd,下载pandas和xlrd两个库。xlrd在2.0版本之后就只支持xls格式的文件。
然后通过pandas.read_excel(文件名)打开文件,即可进行查询操作。注意,这里的文件名可以是绝对地址,也可以是相对地址。
data = pd.read_excel(data1.xls) #令打开的data1.xls文件存储在data中,这里的data1.xls是相对地址,也可以是绝对地址
data = pd.read_excel(io=r" C:\Users\Windows\Desktop\data1.xls") #这里的r表示双引号里面的东西不转义,即不将\当成转义字符。io参数为文件路径。
三种文件格式的方法是一样的:
1,data.head() head方法内部不指定行数时,默认是指前五行;
2,data.head(n) 指定前n行
3,data.tail() 默认最后五行
4,data.columns 指定所有列名
5,data.iloc[[0,2,3,7]] 指定了0,2,3,7行,指定一行或多行
6,data.shape 返回文件的行数和列数
7,data.loc[1:3] 返回1到3行(下标从0开始)
8,data[["食品","交通"]].head()
指定‘食品’和‘交通’两列,head表示返回前五行,则返回前五行‘食品’和‘交通’两列的值
9,data.loc[[1,4],['食品','交通']]
返回1行和4行,‘食品’和‘交通’两列的值
10,data[(data['食品'] >= 100) & (data['交通'] <= 10)].head()
返回满足食品类的值大于等于100,并且交通类的值小于等于10的数据信息,head指定前五行
xlsx格式的文件:
首先需要Win+R,输入cmd打开命令行,然后pip install pandas和pip install openpyxl,下载pandas和openpyxl两个库。openpyxl中是字母L不是数字1。
关于xlsx的方法,和xls格式的文件是一样的。
txt数据格式:
通过pd.read_table(文件名)打开文件
data = pd.read_table("data1.txt")
print(data.head())
#输出data1.txt文件中的前五行
txt的方法,和xls格式的文件是一样的