python导出csv有引号_python – csv中的双引号元素不能用pandas读取

我有一个输入文件,其中每个值都存储为一个字符串.

它位于一个csv文件中,每个条目都在双引号内.

示例文件:

"column1","column2", "column3", "column4", "column5", "column6"

"AM", "07", "1", "SD", "SD", "CR"

"AM", "08", "1,2,3", "PR,SD,SD", "PR,SD,SD", "PR,SD,SD"

"AM", "01", "2", "SD", "SD", "SD"

只有六列.我需要输入哪些选项来pandas read_csv才能正确读取?

我目前正在尝试:

import pandas as pd

df = pd.read_csv(file, quotechar='"')

但这给了我错误信息:

CParserError:标记数据时出错. C错误:第3行预计6个字段,见14

这显然意味着它忽略了”’并将每个逗号解析为一个字段.

但是,对于第3行,第3列到第6列应该是包含逗号的字符串. (“1,2,3”,“PR,SD,SD”,“PR,SD,SD”,“PR,SD,SD”)

如何让pandas.read_csv正确解析?

谢谢.

解决方法:

这会奏效.它回退到python解析器(因为你有非常规的分隔符,例如它们是逗号,有时是空格).如果你只有逗号它会使用c-parser并且速度更快.

In [1]: import csv

In [2]: !cat test.csv

"column1","column2", "column3", "column4", "column5", "column6"

"AM", "07", "1", "SD", "SD", "CR"

"AM", "08", "1,2,3", "PR,SD,SD", "PR,SD,SD", "PR,SD,SD"

"AM", "01", "2", "SD", "SD", "SD"

In [3]: pd.read_csv('test.csv',sep=',\s+',quoting=csv.QUOTE_ALL)

pandas/io/parsers.py:637: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators; you can avoid this warning by specifying engine='python'.

ParserWarning)

Out[3]:

"column1","column2" "column3" "column4" "column5" "column6"

"AM" "07" "1" "SD" "SD" "CR"

"AM" "08" "1,2,3" "PR,SD,SD" "PR,SD,SD" "PR,SD,SD"

"AM" "01" "2" "SD" "SD" "SD"

标签:python,pandas,csv

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值