python怎么打开excel文件并处理_Python打开excel和txt文件

本文介绍了如何使用Pandas库读取Excel和TXT文件,重点讲解了`read_excel`和`read_table`函数的使用。通过设置索引列和转换数据格式,将数据从DataFrame转换为nparray。此外,还展示了如何提取行列,并提供了对TXT文件内容进行循环读取并填充到nparray中的方法。
摘要由CSDN通过智能技术生成

打开excel文件,用pandas库中的read打开程序如下:

filename = 'E:\CAUC\data\energy.xlsx'

data = pd.read_excel(filename, index_col=u'日期')

index_col

是索引,就是按照某一列索引,它的强大功能我先没有发现,先举个小栗子的把,比如你按日期索引,你向画出各列,那么日期就是横坐标(即x轴)。u‘

’是输入中文之前必须要加的符号。没有索引也是可以的。

注:用pandas读入的后,第一行是被索引的,就是像是标签一样的东西。主要用来被索引。

用pandas打开的excel格式是DataFrame格式的,想要把他改成nparray格式,只需执行以下语句

data = np.array(data)

DataFrame格式的数据,提取行列,提取行

data =

data[1:23] #1:23就是要提取的行

提取某列

ele_data =

data[[u'电力(折算吨标煤)']]

#提取列的时候用标签提取,就是第一行的内容,如果有中文字符要用 u‘ ’

若想提取多列,就把中间加“,”把要提取的都写上

以上方法提取行列返回都是DataFrame格式

这是我觉得目前来说比较好用的方法。还有就是直接用包打开,但是感觉不怎么好使。。。

打开TXT文件,第一种和打开excel的方法一样,只需将pd.read_excel换为datatxt =

pd.read_table

还有一种方法不需要用pandas但是比较麻烦。方法如下

fr = open('chongqing.txt')

numrow = len(fr.readline())

mat = np.zeros((numrow,24))

fr = open('chongqing.txt')

index = 0

for line in fr.readlines():

line =

line.strip()

listline =

line.split('\t')

mat[index,:]

= listline

index

+=1

以上方法是先打开这个txt,然后用len()函数计算这个txt的行数,建立一个nparray格式行数与txt一样的空矩阵,然后再用循环把内容放进去。其实我也不太理解这个方法的精髓。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值