介绍如何使用Python的Pandas包进行Excel表格数据梳理(●----●)

本文介绍了如何使用Python的Pandas库进行Excel数据的读取、处理和写入。主要内容包括DataFrame的创建,涉及的数据结构有列表字典、字典列表和双层列表。此外,还详细阐述了Pandas中与Excel相关的read_excel、ExcelWriter和to_excel等函数的参数和用法,以及数据抽取、DataFrame操作和数据持久化的完整流程。
摘要由CSDN通过智能技术生成

DataFrames的简单介绍及其创建

Dataframes相当于是Excel表格中的一个Sheet表,它有列名,行索引,还有每行都有若干个与表的列名对应的数据

在这里插入图片描述

使用Pandas的API可以从一个Excel文件或者CSV文件中读取某一个Sheet表,而这个Sheet表中的数据会被转化成DataFrames的结构。同理,当我们想使用Pandas库将我们格式化后的数据输出到一个Sheet表中(不论是Excel文件或是CSV文件)时,我们也要创建一个DataFrames的结构,将我们的数据以DataFrames的形式作为参数传递给Pandas的函数,让其将我们的数据持久化到文件中,因此,这就是我们学习DataFrames的原因

与创建DataFrames有关的3种数据结构

  • 使用列表字典 ( { ‘column1’ : [‘d1’, ‘d2’, ‘d3’ …], ‘column2’ : [‘d1’, ‘d2’, ‘d3’ … ]… } )
  • 使用字典列表 ( [ { ‘column1’ : ‘d1’, ‘column2’ : ‘d2’ }, { ‘column1’ : ‘d1’, ‘column2’ : ‘d2’ } … ] )
  • 使用双层列表 ( [ [‘d1’, ‘d2’, ‘d3’], [‘d4’, ‘d5’, ‘d6’] … ] )

创建DataFrames的函数

  • pandas.DataFrame( args… )

代码展示


# TODO 使用字典列表创建DataFrames
lists_dicts = list()
dic1 = {
   'name':'name1', 'group':'group1'}
dic2 = {
   'name':'name2', 'group':'group2'}
lists_dicts.append(dic1)
lists_dicts.append(dic2)
df = pd.DataFrame(lists_dicts)
'''
writer = pd.ExcelWriter('/Users/wong/Desktop/test.xlsx')
df.to_excel(writer, index=False)
writer.save()
writer.close()
'''

# TODO 使用列表字典创建DataFrames
dicts_lists = dict()
dicts_lists.setdefault('age', ['age1', 'age2'])
dicts_lists.setdefault('sex', ['sex1', 'sex2'])
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值