Python - 实战 - 如何筛选文本内容

最新推荐文章于 2023-07-11 15:21:26 发布

孤独的侠客

最新推荐文章于 2023-07-11 15:21:26 发布

阅读量6.8k

点赞数 3

分类专栏：开发语言-Python 操作系统-Linux 文章标签： python grep awk 文本过滤内容筛选

本文链接：https://blog.csdn.net/chenyunqiang/article/details/100782791

版权

今天同事向我抛了一个文件，让我帮他将一些特定的行筛选出来。由于时间紧急，我首先想到的处理方法是shell的grep命令，但很快发现grep实现不了。迅速转为python实现，python实现交工后，琢磨了下可以用awk命令能更快的实现。记录下此次实战过程。

1. 需求

同事要求将以下文件数据(示例，已脱敏)按要求拆分为3个文件:

第一个文件要求筛选出第3列以"BS"或"BV"或"BX"或"BT"开头的行
第二个文件要求筛选出第2列中包含“鸡”或"鱼"的行
第三个文件是排除以上一、二要求剩余的行

3,鱼涌公园,B200FFABGOSU
3,鲤鱼门咀,2200
3,鲗鱼涌,BS22325433
3,鲗鱼涌,BV2200324333
3,鸟湖,B20073C200XJ2L
3,鸭兜排,200
3,鸭洲,200
3,鹤咀,200
3,鸡公排,200
3,鸡公头,200
3,鸡宜环,200
3,鸡山,200
3,鸡洲,200
3,鸡脷排,200
3,鸡脷洲,200
3,鸡髀下,200
3,鸬鹚排,200
3,鸿日升科技,B200FFJE2F7I
3,鸿升办馆,B20073C2004U22
3,鹿湖郊游径,B20073C20035LT
3,麦径3段,B20073C2002QI3
3,麦理浩径,B20073C2002VDY
3,麦理浩径,B20073C20035LW
3,黄埔,BS22737322
3,黄埔,BV2200789232
3,黄大仙,BS2200327829
3,黃大仙,BV220032423200
...

2. python实现

python实现

#! /usr/bin/env python
# -*-coding:utf-8 -*-

impo

最低0.47元/天解锁文章

孤独的侠客

关注

3
点赞
踩
33

收藏

觉得还不错? 一键收藏
1
评论
Python - 实战 - 如何筛选文本内容

今天同事向我抛了一个文件，让我帮他将一些特定的行筛选出来。由于时间紧急，我首先想到的处理方法是shell的grep命令，但很快发现grep实现不了。迅速转为python实现，python实现交工后，琢磨了下可以用awk命令能更快的实现。记录下此次实战过程。1. 需求同事要求将以下文件数据(示例，已脱敏)按要求拆分为3个文件:第一个文件要求筛选出第3列以"BS"或"BV"或"BX"或"BT"...
复制链接

扫一扫

专栏目录