作者:黄伟
来源:杰哥的IT之旅(ID:Jake_Internet)
转载请联系授权(WeChat ID:Hc220066)
一、相关知识点讲解
1、需要使用的相关库
1import numpy as np
2import pandas as pd
3import os
2、os.walk(pwd)
举例如下
① 先来看看"G:\a"文件夹下有哪些东西。
② 代码操作如下:
1pwd = "G:\\a"
2print(os.walk(pwd))
3for i in os.walk(pwd):
4 print(i)
5for path,dirs,files in os.walk(pwd):
6 print(files)
③ 结果如下:
1object walk at 0x0000029BB5AEAB88>2('G:\\a', [], ['aa.txt', 'bb.xlsx', 'cc.txt', 'dd.docx'])3['aa.txt', 'bb.xlsx', 'cc.txt', 'dd.docx']
3、os.path.join(path1,path2…)
作用:将多个路径组合后返回
举例如下
1path1 = 'G:\\a'
2path2 = 'aa.txt'
3print(os.path.join(path1,path2))
结果如下:
1G:\a\aa.txt
4、案例解析
举例如下:
1pwd = "G:\\a"
2file_path_list = []
3for path,dirs,files in os.walk(pwd):
4 for file in files:
5 file_path_list.append(os.path.join(pwd,file))
6print(file_path_list)
结果如下:
1['G:\\a\\aa.txt','G:\\a\\bb.xlsx','G:\\a\\cc.txt','G:\\a\\dd.docx']
5、怎么在一个列表中存放多个DataFrame数据。
1# 先使用如下代码创建两个DataFrame数据源。
2import numpy as np
3xx = np.arange(15).reshape(5,3)
4yy = np.arange(1,16).reshape(5,3)
5xx = pd.DataFrame(xx,columns=["语文","数学","外语"])
6yy = pd.DataFrame(yy,columns=["语文","数学","外语"])
7print(xx)
8print(yy)
结果如下:
怎么讲上述两个DataFrame拼接在一起?
1concat_list = []
2concat_list.append(xx)
3concat_list.append(yy)
4# pd.concat(list)中【默认axis=0】默认的是数据的纵向合并。
5# pd.concat(list)括号中传入的是一个DataFrame列表。
6# ignore_list=True表示忽略原有索引,重新生成一组新的索引。
7z = pd.concat(concat_list,igno