pandas 读取局域网文件_Pandas读取文件

最新推荐文章于 2023-01-16 17:47:05 发布

蜜糖宝宝

最新推荐文章于 2023-01-16 17:47:05 发布

阅读量774

点赞数

文章标签： pandas 读取局域网文件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42292183/article/details/111976484

版权

本文介绍了如何使用pandas在Python中创建Excel文件，并详细展示了如何读取局域网内的Excel文件，包括设置自定义列名、处理不同情况的头部信息以及数据的重置和存储。此外，还涉及到了对数据的读取、处理和存储的实际操作，如读取特定列、修改数据、重设索引和保存到新的Excel文件。

摘要由CSDN通过智能技术生成

# 1. 使用to_excel创建Excel文件

import pandas as pd

df = pd.DataFrame({'id':[1,2,3],'name':['zs','ls','ww']})

# 默认会有索引，将ID列设置成索引,会返回一个新的df,如果想要在原来的df上修改需要添加参数inplace=True

df = df.set_index('id')

df.to_excel('./output.xlsx')

print('end')

# 2. 使用pandas读取文件

import pandas as pd

# 此处需要安装依赖库xlrd

people = pd.read_excel('~/Desktop/People.xlsx')

print('获取文件中的行和列:',people.shape)

print("-"*20)

print('获取文件中的列名:',people.columns)

print("-"*20)

# 默认取前五行

print('获取文件中的前几行数据信息:',people.head())

print("-"*20)

print('获取文件中的后几行数据信息:',people.tail())

print("-"*20)

# 注意常见问题:

# 1. 读取的时候，默认会将第一行作为列名，我们可以修改

people = pd.read_excel('~/Desktop/People.xlsx',header = 1)

print(people.columns)

输出：

获取文件中的行和列: (19972, 6)

--------------------

获取文件中的列名: Index(['ID', 'Type', 'Title', 'FirstName', 'MiddleName', 'LastName'], dtype='object')

--------------------

获取文件中的前几行数据信息: ID Type Title FirstName MiddleName LastName

0 1 Employee NaN Ken J Sánchez

1 2 Employee NaN Terri Lee Duffy

2 3 Employee NaN Roberto NaN Tamburello

3 4 Employee NaN Rob NaN Walters

4 5 Employee Ms. Gail A Erickson

--------------------

获取文件中的后几行数据信息: ID Type Title FirstName MiddleName LastName

19967 20773 Individual Customer NaN Crystal NaN Guo

19968 20774 Individual Customer NaN Isabella F Richardson

19969 20775 Individual Customer NaN Crystal S He

19970 20776 Individual Customer NaN Crystal NaN Zheng

19971 20777 Individual Customer NaN Crystal NaN Hu

--------------------

Index([1, 'Employee', 'NULL', 'Ken', 'J', 'Sánchez'], dtype='object')

# 2. 使用pandas读取文件

import pandas as pd

#2. 如果第一行或者其他行不满足我们的需求时，我们可以自定义

# 第一种: 设置header为None，会使用默认的01234

people = pd.read_excel('~/Desktop/People.xlsx',header = None)

print(people.columns)

print("-"*20)

print(people.head())

print("-"*20)

# 第二种: 认为的设置默认值

people.columns = ['ID1','Type1','Title1','FirstName1','MiddleName1','LastName1']

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。