Python之pandas学习【9】：利用pandas筛选出CSV某几列的数据进行数据处理

最新推荐文章于 2023-03-21 19:51:35 发布

strong tyj

最新推荐文章于 2023-03-21 19:51:35 发布

阅读量5.6k

点赞数 2

分类专栏： # Python基础学习

本文链接：https://blog.csdn.net/qq_36499794/article/details/103547995

版权

本文介绍了一次实战任务，使用pandas从CSV文件中选择特定列，并结合re模块进行正则表达式的数据处理。通过比较，得出结论：在pandas中处理数据应优先使用map而非for循环，以提高效率。

摘要由CSDN通过智能技术生成

今天做了一个实战性的任务，利用pandas筛选出CSV的某几列数据进行数据处理，数据处理用的是re模块，也就是正则表达式。

直接上代码，注意看代码注释，自己运行一遍结合代码注释是最好的效果

代码：

import re
import pandas as pd
import time

class jk_jd():
    # 方法1:传统for循环
    def solution(self,data):
        col = ['x','y'] # 定义要筛选的列
        data_del =  pd.DataFrame(data,columns=col) # 提取出要筛选的列，装到dataframe中
        for i in range(len(data_del['x'])): # 遍历dataFrame中的每一行，进行正则表达式的匹配处理
            data_del['x'][i] = re.sub("<br>(.*)", "", data_del['x'][i]) # 删掉<br>后面的所有数据
            data_del['x'][i] = re.sub("【(.*?)】","",data_del['x'][i]) # 删掉【】中的所有数据
        data_del.to_csv("deal.csv") # 导出为CSV文件
    
    # 方法2:pandas的map模块方式
    def solution1(self,data):
        col = ['x','y']
        data_dele =

最低0.47元/天解锁文章

strong tyj

关注

2
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
Python之pandas学习【9】：利用pandas筛选出CSV某几列的数据进行数据处理

今天做了一个实战性的任务，利用pandas筛选出CSV的某几列数据进行数据处理，数据处理用的是re模块，也就是正则表达式。直接上代码，注意看代码注释，自己运行一遍结合代码注释是最好的效果代码：import reimport pandas as pdimport timeclass jk_jd(): # 方法1:传统for循环 def solution(self...
复制链接

扫一扫

专栏目录