Python数据分析(二):批量读取Excel文件并命名变量
之前在处理论文数据时,遇到了年份数据,不同年份的数据格式一样,只是年份不一样,文件名分别是data2009、data2001、…、data2018,十年的数据,我当时用的Rstudio,硬是写了十遍的读取数据(哭泣),后面调用数据的时候,也十分麻烦。既然接触了编程,不就是为了偷懒吗,所以研究了下怎么批量读取数据。
批量读取excel数据
在我之前的文章里面有介绍过python利用pandas中的read_csv()读取单个excel文件,因此我们只需要批量生成文件的名称即可,然后循环读取文件名。
# 假设本地保存的文件名分别为data2000、data2001、......、data2020.
Year = range(2000, 2021)
creat_var = locals() # 利用locals()创建变量
for year in Year:
file_path = '/Users/Hubans/Desktop//data' + str(year1) + '.csv'
# 不同年份的路径名,如果是list的变量名就更简单了
data = pd.read_csv(file_path, encoding='utf-8')
creat_var['data' + str(year)] = data
# 这样就创建了一个包含数据变量名和数据的字典
print(creat_var['data2016'])
print(data2016)
# 虽然编译软件可能会给data2016标红,但是不影响
这是我自己找的办法,可能比较笨,如果有更简单的方法,希望大佬可以指出(感谢)。