Python - 实战 - 如何筛选文本内容

今天同事向我抛了一个文件,让我帮他将一些特定的行筛选出来。由于时间紧急,我首先想到的处理方法是shell的grep命令,但很快发现grep实现不了。迅速转为python实现,python实现交工后,琢磨了下可以用awk命令能更快的实现。记录下此次实战过程。

1. 需求

同事要求将以下文件数据(示例,已脱敏)按要求拆分为3个文件:

  • 第一个文件要求筛选出第3列以"BS"或"BV"或"BX"或"BT"开头的行
  • 第二个文件要求筛选出第2列中包含“鸡”或"鱼"的行
  • 第三个文件是排除以上一、二要求剩余的行
3,鱼涌公园,B200FFABGOSU
3,鲤鱼门咀,2200
3,鲗鱼涌,BS22325433
3,鲗鱼涌,BV2200324333
3,鸟湖,B20073C200XJ2L
3,鸭兜排,200
3,鸭洲,200
3,鹤咀,200
3,鸡公排,200
3,鸡公头,200
3,鸡宜环,200
3,鸡山,200
3,鸡洲,200
3,鸡脷排,200
3,鸡脷洲,200
3,鸡髀下,200
3,鸬鹚排,200
3,鸿日升科技,B200FFJE2F7I
3,鸿升办馆,B20073C2004U22
3,鹿湖郊游径,B20073C20035LT
3,麦径3段,B20073C2002QI3
3,麦理浩径,B20073C2002VDY
3,麦理浩径,B20073C20035LW
3,黄埔,BS22737322
3,黄埔,BV2200789232
3,黄大仙,BS2200327829
3,黃大仙,BV220032423200
...

2. python实现

python实现

#! /usr/bin/env python
# -*-coding:utf-8 -*-

impo
  • 3
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值