使用Pandas读取CSV文件：sep操作

最新推荐文章于 2024-04-19 20:45:00 发布

愚昧之山绝望之谷开悟之坡

最新推荐文章于 2024-04-19 20:45:00 发布

阅读量2.5k

点赞数 2

分类专栏： python 笔记文章标签： css3 前端 css

本文链接：https://blog.csdn.net/qq_15821487/article/details/123275924

版权

笔记同时被 2 个专栏收录

635 篇文章 16 订阅

订阅专栏

python

344 篇文章 10 订阅

订阅专栏

我有一个csv文件，我想用python panda读取它。标题和行如下所示：

 A           ^B^C^D^E  ^F          ^G           ^H^I^J^K^L^M^N
很明显，分隔符是^，有时有一些奇怪的空格。我怎样才能把这个文件读得很好？

我正在使用以下命令读取csv文件：

df = pd.read_csv('input.csv', sep='^')

你不能提供regex作为分隔符吗？

sep = re.compile(r'[\^\s]+')

使用regex\s*\^这意味着0个或多个空格和^，您必须在此处指定python引擎以避免出现有关regex支持的警告：

In [152]:

t="""A           ^B^C^D^E  ^F          ^G           ^H^I^J^K^L^M^N"""
df= pd.read_csv(io.StringIO(t), sep='\s*\^', engine='python')
df.columns
Out[152]:
Index(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N'], dtype='object')

分隔符可以是正则表达式，因此请尝试以下操作：

df = pd.read_csv('input.csv', sep="[ ^]+")
正则表达式应在一行中使用任意数量的空格或插入符号（^）作为单个分隔符。

愚昧之山绝望之谷开悟之坡

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用Pandas读取CSV文件：sep操作

我有一个csv文件，我想用python panda读取它。标题和行如下所示： A ^B^C^D^E ^F ^G ^H^I^J^K^L^M^N很明显，分隔符是^，有时有一些奇怪的空格。我怎样才能把这个文件读得很好？我正在使用以下命令读取csv文件：df = pd.read_csv('input.csv', sep='^')你不能提供regex作为分隔符吗？sep = re.compile(r'[\^\s]+')使用regex
复制链接

扫一扫