python从csv提取需要的数据_从CSV文件Python中提取某些头的数据

这篇博客主要介绍了如何使用Python的pandas库从CSV文件中提取特定行的数据,特别是针对包含空值的列。通过创建DataFrame并进行条件筛选,实现了数据过滤并保存到新的CSV文件中。
摘要由CSDN通过智能技术生成

最终编辑:

问题描述

在您发布了real数据文件(https://imgur.com/a/AgRMC8S)的一部分之后,

问题和解决方案立即变得清晰:

您的csv文件是一个简单、完全标准对齐的csv文件,其中逗号作为分隔符(请参见蓝色标记),因此即使是空单元格也可以轻松处理,因为它们只是两个直接连续的逗号(请参见红色标记)。

一、 你的样本数据与你的真实数据无关。。。

正确的等效示例数据文件应该是C.N,Cmp,Cmp,Cmp,Cmp,Cmp,Cmp,Cmp

C.N2,IGN,IGT,IGA,,IGB,IGB,

php,12,12,11,35,5,1,6

java,12,12,11,35,5,1,6

react,100,100,100,35,100,100,6

IOS,12,12,11,35,5,1,6

python,12,12,11,35,5,1,6

JSX,12,12,11,35,5,1,6

这就是为什么@kerwei的pandas解决方案基于简单的pd.read_csv,并使用逗号作为默认分隔符,但csv示例数据中没有一个逗号。在

回答正确的问题

在代码片段中,打印每一行,直到到达感兴趣的行之后。

但是你不应该打印任何东西,除非你到达了你感兴趣的那一行:

^{pr2}$

但是,使用pandas可以更优雅地解决过滤行的附加要求,因此我的pandas方法如下所示:import pandas as pd

df = pd.read_csv(filename, index_col=0)

df_r = df.loc[['C.N2', 'react'], ~df.loc['C.N2'].isna()]

# Cmp Cmp.1 Cmp.2 Cmp.4 Cmp.5

#C.N

#C.N2 IGN IGT IGA IGB IGB

#react 100 100 100 100 100

只将此结果的数据行(不带标题和索引的df)写入另一个csv文件同样简单:df_r.to_csv('react.csv', header=False, index=False)

#IGN,IGT,IGA,IGB,IGB

#100,100,100,100,100

当然,没有外部库,你也可以做到这一点with open(filename) as f:

next(f)

header = f.readline().strip().split(',')

drop_idx = [i for i, h in enumerate(header) if not h]

for line in f:

if line.startswith('react'):

data = line.strip().split(',')

break

for i in drop_idx[::-1]:

header.pop(i)

data.pop(i)

with open('react.csv', 'w') as f:

f.write(','.join(header[1:]) + '\n')

f.write(','.join(data[1:]))

最后一点是对未来问题的一个要求:请尝试用[mcve]来简化你的问题,使你真正的问题的重要属性不会丢失,这样可以节省很多时间。在

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值