学习Pandas(十一)

英文原文: 11 - Lesson

从多个 Excel 文件中读取数据并且在一个 dataframe 将这些数据合并在一起。

import pandas as pd
import matplotlib
import os
import sys
%matplotlib inline
print('Python version ' + sys.version)
print('Pandas version ' + pd.__version__)
print('Matplotlib version ' + matplotlib.__version__)
Python version 3.6.1 | packaged by conda-forge | (default, Mar 23 2017, 21:57:00) 
[GCC 4.2.1 Compatible Apple LLVM 6.1.0 (clang-602.0.53)]
Pandas version 0.19.2
Matplotlib version 2.0.2

创建 3 个 Excel 文件

# 创建 DataFrame
d = {'Channel':[1], 'Number':[255]}
df = pd.DataFrame(d)
df
ChannelNumber
01255

# 导出到 Excel 文件中

df.to_excel('test1.xlsx', sheet_name = 'test1', index = False)
df.to_excel('test2.xlsx', sheet_name = 'test2', index = False)
df.to_excel('test3.xlsx', sheet_name = 'test3', index = False)
print('Done')
    Done

把 3 个 Excel 文件数据读入一个 DataFrame

把 Excel 文件名读入到一个 list 中,并确保目录下没有其他 Excel 文件。

# 放文件名的 list
FileNames = []

# 你存放Excel文件的路径可能不一样,需要修改。
os.chdir(r"./")

# 找到所有文件扩展名是 .xlsx 的文件
for files in os.listdir("."):
    if files.endswith(".xlsx"):
        FileNames.append(files)

FileNames
    ['test1.xlsx', 'test2.xlsx', 'test3.xlsx']

创建一个函数来处理所有的 Excel 文件。

def GetFile(fnombre):

    # Excel 文件的路径
    # 你存放Excel文件的路径可能不一样,需要修改。
    location = r'./' + fnombre

    # 读入 Excel 文件的数据
    # 0 = 第一个页签
    df = pd.read_excel(location, 0)

    # 标记一下数据是从哪个文件来的
    df['File'] = fnombre

    # 把 'File' 列作为索引
    return df.set_index(['File'])

对每一个文件创建一个 dataframe,把所有的 dataframe 放到一个 list 中。

即,
df_list = [df, df, df]

# 创建一个 dataframe 的 list
df_list = [GetFile(fname) for fname in FileNames]
df_list
[            Channel  Number
 File                       
 test1.xlsx        1     255,             Channel  Number
 File                       
 test2.xlsx        1     255,             Channel  Number
 File                       
 test3.xlsx        1     255]
# 把 list 中所有的 dataframe 合并成一个
big_df = pd.concat(df_list)
big_df
ChannelNumber
File
test1.xlsx1255
test2.xlsx1255
test3.xlsx1255

big_df.dtypes
    Channel    int64
    Number     int64
    dtype: object
# 画一张图
big_df['Channel'].plot.bar();

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值