用python快速列向处理数据(readlines,split,join,with...open应用)

面对上万行的数据,文章介绍了如何使用Python高效地处理数据,特别是删除冗余行。对比了传统的手动删除和使用其他工具的方法,重点展示了通过Python的readlines、split、join和with...open等函数进行文件操作和数据处理的步骤。
摘要由CSDN通过智能技术生成

本文示例1.txt中,有上万行数据,但我只需要前两项用作后续处理计算,该如何快速删除冗余数据?方法有:

  • 使用传统方法鼠标选中一行一行删除

  • 用word打开,如果数据长度一致的情况下,可以按住alt进行框选删除(还需配合其他快捷键选中后一键跳到文末)

  • 度娘一下有没有小插件能够转为Excel文本

  • 利用手头现有工具如matlab,python,java等进行批量处理

这里选用python进行演示

1.txt(待处理文件)

with open ("1.txt",'r') as f:
    a = f.readlines
如果您不想使用pandas库,也可以使用Python将DeepFashion数据集中的list_attr_img.txt文件转换为CSV文件。可以按照以下代码进行操作: ```python # 读取list_attr_img.txt文件 with open('list_attr_img.txt', 'r') as f: lines = f.readlines() # 处理每行数据 data = [] for line in lines[2:]: line = line.strip().split() img_path = line[0] attrs = line[1:] attrs = [int(x) for x in attrs] data.append([img_path] + attrs) # 将数据保存为CSV文件 with open('list_attr_img.csv', 'w') as f: # 写入列名 f.write('image_name,') f.write(','.join(lines[1].strip().split()[1:]) + '\n') # 写入数据 for line in data: line = [str(x) for x in line] f.write(','.join(line) + '\n') ``` 解释: 1. 首先使用open()函数读取list_attr_img.txt文件,将每行数据读取为一个字符串。 2. 对于每行数据,使用strip()函数去除空格和换行符,并使用split()函数将其拆分为图像路径和属性值。 3. 将属性值转换为整数类型。 4. 将图像路径和属性值组成一个列表,并添加到data列表中。 5. 使用open()函数创建CSV文件,并使用write()函数将data列表中的数据写入CSV文件中。在写入CSV文件时,首先使用join()函数将列名转换为一个字符串,然后写入CSV文件;接着,使用join()函数将每行数据转换为一个字符串,并使用逗号分隔每个数据项。 这样,就可以使用Python将DeepFashion数据集中的list_attr_img.txt文件转换为CSV文件了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值