Python之pandas学习【9】:利用pandas筛选出CSV某几列的数据进行数据处理

本文介绍了一次实战任务,使用pandas从CSV文件中选择特定列,并结合re模块进行正则表达式的数据处理。通过比较,得出结论:在pandas中处理数据应优先使用map而非for循环,以提高效率。
摘要由CSDN通过智能技术生成

今天做了一个实战性的任务,利用pandas筛选出CSV的某几列数据进行数据处理,数据处理用的是re模块,也就是正则表达式。

直接上代码,注意看代码注释,自己运行一遍结合代码注释是最好的效果

代码:

import re
import pandas as pd
import time

class jk_jd():
    # 方法1:传统for循环
    def solution(self,data):
        col = ['x','y'] # 定义要筛选的列
        data_del =  pd.DataFrame(data,columns=col) # 提取出要筛选的列,装到dataframe中
        for i in range(len(data_del['x'])): # 遍历dataFrame中的每一行,进行正则表达式的匹配处理
            data_del['x'][i] = re.sub("<br>(.*)", "", data_del['x'][i]) # 删掉<br>后面的所有数据
            data_del['x'][i] = re.sub("【(.*?)】","",data_del['x'][i]) # 删掉【】中的所有数据
        data_del.to_csv("deal.csv") # 导出为CSV文件
    
    # 方法2:pandas的map模块方式
    def solution1(self,data):
        col = ['x','y']
        data_dele = 
  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值