pandas 用read_csv读取txt文件时,部分行丢失

用pandas 的 read_csv 来读取txt文件时,出现了部分行丢失的情况。
原因是某行中有单个英文引号,导致\n换行符失效。
多行连成了一行,直到遇到下一个单个引号。

例如:

.txt文件如下:
	这里有一个未闭合的引号"就是它!
	这是正常的第二行
	这是正常的“第三行”
	这是带着"英文引号"的第四行
	这是第五行

如果存在不闭合的英文引号,行与行之间会“粘”在一起,看起来就是丟行了:

import pandas as pd
df = pandas.read_csv('test.txt', names=['sentences'])

# 结果
# 这里有一个未闭合的引号"就是它!\r这是正常的第二行\r这是正常的“第三行”\r这是带着"英文引号"的第四行
# 这是第五行

解决办法:设置quoting参数

# 方法一: 加 quoting=3
import pandas as pd
df = pandas.read_csv('test.txt', names=['sentences'], quoting=3)

# 方法二:
import csv
import pandas as pd
df = pandas.read_csv('test.txt', names=['sentences'], quoting=csv.QUOTE_NONE)
  • 6
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值