Python正则提取csv内容

lvshaorong

已于 2022-06-21 09:53:45 修改

阅读量3.2k

点赞数 1

文章标签： python

于 2019-03-21 17:53:01 首次发布

本文链接：https://blog.csdn.net/lvshaorong/article/details/88720348

版权

本文介绍了如何使用Python处理CSV文件，特别是面对字段中可能包含逗号的情况。通过正则表达式，可以避免分割错误，同时处理空值和混合类型的字段。文中详细讲解了两种方法：一是先用正则分割再按下标获取，二是直接在正则表达式中赋值给变量。

摘要由CSDN通过智能技术生成

一般我们把数据库或者试算表导出后都会变成，分割值或|分割值的方式，每一行是数据库里的一行内容，如果此时我们需要使用Python将导出之后的文件进行导入并实现字段化，那么一般由两种方式（下文环境为Python3.7）

1、使用，作为分割符，获得一个数组然后根据下标进行获取，如下

    for line in file:
        infos = line.split(',')
        date = int(infos[0])
        amount = float(infos[1])
        corp = infos[2]
        name = infos[3]
        idCard = infos[4]

但是这种模式弊端很明显，如果有一个字段里面含有了逗号，那么这样分割就会出现错乱。非常不灵活

2、使用正则表达式进行匹配，可以有效预防上面出现的问题

比如我们有下面这一个字符串

"002666666+AA","8","刘老三","551290000007",,"王老五","306660007","aabbcc ",10,"01","20190321","663419","你好，老王！"

我们如果使用逗号作为分割，那么最后一列数据就会因为内容中含有一个标点逗号而导致分割出错，而且元素众多，有的元素还是空值，如王老五前面的那个元素。而且还数字字符串夹杂在一起，字符串的前后还带着双引号，在提取数据时需要将双引号都去掉。那

最低0.47元/天解锁文章

lvshaorong

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Python正则提取csv内容

一般我们把数据库或者试算表导出后都会变成，分割值或|分割值的方式，每一行是数据库里的一行内容，如果此时我们需要使用Python将导出之后的文件进行导入并实现字段化，那么一般由两种方式（下文环境为Python3.7）1、使用，作为分割符，获得一个数组然后根据下标进行获取，如下 for line in file: infos = line.split(',') ......
复制链接

扫一扫