Pandas库read_excel()使用说明及 excel转换为tsv python实现方法一:

pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_col = None,usecols = None,squeeze = False,dtype = None, ...)

io:字符串,文件的路径对象。


sheet_name:None、string、int、字符串列表或整数列表,默认为0。字符串用于工作表名称,整数用于零索引工作表位置,字符串列表或整数列表用于请求多个工作表,为None时获取所有工作表。

对应操作
sheet_name=0第一张作为DataFrame
sheet_name=1第二张作为DataFrame
sheet_name=“Sheet1”第一张作DataFrame
sheet_name=[0,1,'Sheet5']第1页,第2页和第5页作为DataFrames的字典。

header:指定作为列名的行,默认0,即取第一行的值为列名。数据为列名行以下的数据;若数据不含列名,则设定 header = None。


names:默认为None,要使用的列名列表,如不包含标题行,应显示传递header=None


index_col:指定列为索引列,默认None列(0索引)用作DataFrame的行标签。


usecols:int或list,默认为None。

  • 如果为None则解析所有列
  • 如果为int则表示要解析的最后一列
  • 如果为int列表则表示要解析的列号列表
  • 如果字符串则表示以逗号分隔的Excel列字母和列范围列表(例如“A:E”或“A,C,E:F”)。范围包括双方。

squeeze:boolean,默认为False,如果解析的数据只包含一列,则返回一个Series。


dtype:列的类型名称或字典,默认为None。数据或列的数据类型。例如{'a':np.float64,'b':np.int32}使用对象保存存储在Excel中的数据而不解释dtype。如果指定了转换器,则它们将应用于dtype转换的INSTEAD。


skiprows:省略指定行数的数据,从第一行开始。


skipfooter:省略指定行数的数据,从尾部数的行开始。


dtype:字典类型{'列名1':数据类型,‘列名’:数据类型},设定指定列的数据类型。

其余参数不常使用,不做补充。

结合上面,今天把一个 excel转换为tsv文件,并且只保留前两列,采用代码如下:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1', usecols=[0,1],header=None)	
print('开始写入txt文件...')
df.to_csv('test.tsv', header=None, sep='\t', index=False)	
print('文件写入成功!')


参考链接:https://www.jianshu.com/p/d1eed925509b

python快速将excel文件转化为txt文件_tszupup的博客-CSDN博客_python将excel转为txt

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pandas.read_csv() 是 pandas 中用于读取 CSV 文件的函数。它可以从 CSV 文件中读取数据,并将其转换为一个 pandas 的 DataFrame 对象。 read_csv() 函数的语法如下: ```python pandas.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, encoding=None, dtype=None, skiprows=None, skip_blank_lines=True, na_values=None) ``` 参数说明: - filepath_or_buffer: 可以是 CSV 文件的路径,也可以是 URL、文件型对象或者是一个带有 read() 方法的变量。 - sep: 字段分隔符,默认为逗号。 - delimiter: 同 sep,指定字段分隔符。 - header: 指定 CSV 文件中的哪一行作为表头,默认为第一行。 - names: 用于指定列名。 - index_col: 用于指定索引列。 - usecols: 用于指定读取哪些列。 - encoding: 用于指定编码方式。 - dtype: 用于指定每一列的数据类型。 - skiprows: 用于指定需要跳过的行数。 - skip_blank_lines: 是否跳过空行,默认为 True。 - na_values: 用于指定需要将哪些值视为缺失值。 示例: ```python import pandas as pd # 读取 CSV 文件 df = pd.read_csv('data.csv') # 指定分隔符为制表符 df = pd.read_csv('data.tsv', sep='\t') # 指定列名 df = pd.read_csv('data.csv', names=['id', 'name', 'age']) # 指定索引列 df = pd.read_csv('data.csv', index_col='id') # 指定读取哪些列 df = pd.read_csv('data.csv', usecols=['id', 'name']) # 指定每一列的数据类型 df = pd.read_csv('data.csv', dtype={'id': int, 'age': float}) ``` 注意:在使用 read_csv() 函数时,应该根据实际情况选择适当的参数进行配置,以确保读取到正确的数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值