关于sed命令去除文本当中每个字段前后空格及tab效率低下的解决办法

最新推荐文章于 2023-03-23 14:10:40 发布

叶金迟

最新推荐文章于 2023-03-23 14:10:40 发布

阅读量1.7k

点赞数 1

本文链接：https://blog.csdn.net/u011803182/article/details/71740193

版权

最近使用到sed命令进行文本处理，因从数据库中获取到的字段当中有个别字段中间包含空格，而最终保存时候要保证每个字段数据的完整性，所以默认的文本分割方式不能使用。

首先使用read读取一行数据line_data，再根据分隔符'"'进行拆分，拆分结果保存到split_data中，因数据的列数可以确定，所以对split_data进行处理时，可根据下标进行。

line_data的格式为'test1 xxxx "test2 "test3 "test 4 "test5 "test6'这种。

之前使用for循环，在将line_data使用双引号分隔符分割之后，再用sed命令去去除每个字段后的空格及tab键。

splitline[i]=`echo ${splitline[i]}|sed -e 's/\(^[ \t] *\)//' -e 's/\([ \t]*$\)//'`

但是对于一个有4000多行，每一行有39个字段的文本来说，处理下来要6分钟左右，效率极为低下。

想要寻找一种高效的解决办法。

所知的有sed、awk、grep等方式。

---------------------------------------------------------------

现在想到一种折中的办法，先将line_data里的空格都去掉，然后后面的for循环当中就不需要使用sed命令了，能将处理速度提高到17秒左右，也算是一种改进。

line=`echo ${line}|sed -e 's/\([ \t]*\)"/"/g'`

后面用for循环的时候就可以直接拆分line_data啦。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

叶金迟

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

sed命令去除每行末尾/前缀多余空格

weixin_53389944的博客

08-12

303

下的所有文件中去除末尾的多余空格。请注意在操作前备份文件或谨慎执行操作，以免丢失重要数据。表示使用正则表达式匹配行末尾的空格字符，并将其替换为空。命令来去掉文本行末尾的多余空格。如果要处理所有文件中的多余空格，可以使用。文件中的文本行末尾多余的空格将被去除。在Linux系统中，可以使用。参数表示直接修改文件内容，上面的命令会在指定的目录。

sed修改文本命令

Struggle_Hard_Z的博客

12-21

893

文本处理命令 sort命令 sort是排序的命令，默认使用第一个字符进行排序 -n # 依照数值的大小排序 [root@localhost ~]# cat 1.txt | sort -n -r # 以相反的顺序来排序 [root@localhost ~]# cat 1.txt | sort -n -r -k # 以某列进行排序（默认的分隔符是空格） [root@localhost ~]# cat 2.txt | sort -n -k2 -t # 指定分割符，

1 条评论您还未登录，请先登录后发表或查看评论

sed删除空行、换行符的方法（包括空格、特殊字符、tab等组成的空行） vim删除^M

qq_41847721的博客

04-01

7044

sed '/^\s*$/d' storage.txt 有时候生成的数据文件中有空行，或者在空行中还有空格、tab、特殊字符(如：^M)等，而且文件又特别大，那怎么处理呢？可以通过Linux命令sed实现去除这些空行。如果都是空行，而空行中没有字符的情况(但是不建议这样写) sed -i ‘/^$/d’ test.txt 建议加入 [[:space:]] 用以匹配空格、tab、^M 等特殊字符 sed -i ‘/1*$/d’ test.txt 上述建议方式的简化版(本人比较喜爱的一种方式，但特殊字符只匹配

让sed帮我们提高工作效率

weixin_34150503的博客

11-01

130

Sed原本是unix下的一个文本编辑工具，但是在windows下却可以帮我们提高工作和办事效率，好啦不多说啦让我们进入今天的正题。首先了解它的格式，在unix下它的格式为sed –e ''但是在windows下这样是不行的，应该是sed -e ""双引号的格式. 一、替换删除指定字符：前几天在网上找克莱德曼的钢琴曲，好不容易找到了把下载地址复制下来一看是这样的...

sed删除空行和开头的空格和tab键

weixin_34402090的博客

09-20

400

[root@ob1 scripts]# cat -An tt2.txt 1jeyry$ 2 ^I$ 3jfdkjfdjk$ 4^Ikjfdkjfdkj$ 5 klfdklfdkl$ 6fdjkkjf dfj ^Ifkdjkjf$ 7^I$ 8ffdkkjfd$ [root@ob1 scripts]#...

sed删除行首和行尾空格或者TAB

热门推荐

richerg85的专栏

01-04

4万+

实例： liujl@liujl-ThinkPad-Edge-E431:~/mybash/test$ cat seddlt 1、I am eagerly awaiting my next disappointment. —Ashleigh Brilliant 2、Every man’s memory is his private literature. —Aldous Huxl

sed去除前面空格

weixin_33979363的博客

02-24

648

今天写一脚本时要去除字符串前面的空格，随便到网上找了个SED，如下： sed 's/^[[:space:]]\+//' 然后我就用到了我的字符串中： re=$x|sed 's/^[[:space:]]\+//' echo $re 这时就奇怪了，就想不通为什么老是输出空格。搞了半天没搞定，直接找master。最后他直接说明显的有二个错误，第一，管道符是把前...

Linux的文本三剑客awk、sed、grep及其他文本处理命令，详细解析

cylcylccyyll的博客

07-14

674

s的使用为s/旧/新/，/([a-z]+)([a-z]+)([a-z]+)/为在echo处匹配到的，位置分别为123，/\3\2\1/是将前面的位置变成321“\”为转义字符，可以让其后面的内容原样输出。name[$1]拿$1做字段key让$2做value，如果这个数组里面有key，就累加，初始值是0+value，END是文件里所有的行都处理完了，最后去执行end部分的命令，end里面的只执行一次。egrep相当于grep-E支持扩展正则，-o只会输出你所匹配到的，不匹配的不输出。......

## Linux面试问题汇总----文件处理grep,awk,sed这三个命令必知必会

weixin_41563161的博客

01-26

1821

文件处理grep,awk,sed这三个命令必知必会 grep、sed和awk都是文本处理工具，虽然都是文本处理工具单却都有各自的优缺点，一种文本处理命令是不能被另一个完全替换的，否则也不会出现三个文本处理命令了。只不过，相比较而言，sed和awk功能更强大而已，且已独立成一种语言来介绍。 grep：文本过滤器，如果仅仅是过滤文本，可使用grep，其效率要比其他...

sed命令和awk命令

weixin_55609814的博客

05-20

1604

sed命令sed命令■什么是sedsed的工作流程命令格式常用选项:常用操作:打印内容sed编辑器的寻址方式删除行替换插入 sed命令 ■什么是sed ●sed是一种流编辑器，流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。 ●sed编辑器可以根据命令来处理数据流中的数据，这些命令要么从命令行中输入，要么存储在一个命令文本文件中。 sed的工作流程 ●sed的工作流程主要包括读取、执行和显示三个过程： ♦读取: sed 从输入流(文件、管道、标准输入）中读取一行内容并存储到临时的缓冲

用sed、awk和grep处理文本数据：实际需求的有效解决方案

最新发布

漠效的博客

03-23

805

工作了好几年，也积攒了大量的脚本，有需求了改改旧脚本就可以了。对于以前没写过的脚本，比如想完成一个新需求，而某些参数可以满足的情况，网上搜索后，加上就行了，有什么困难的呢？所以对 “我” 个人来说，只有 “我” 有需要的参数对 “我” 才是有价值的，并且大多数的人实际上并不会用到除了常用的几个参数的其他功能，就是说很多功能它设计出来有，但是实际在大部分的生产环境中人们并不会用到。

Linux sed替换内容中有空格解决办法

学亮编程手记

08-24

7939

配置文件中有一行如下： server 192.168.3.66 iburst minpoll 3 maxpoll 6 希望修改里面的ip地址改为192.168.3.123，配置文件名为/etc/ntp.conf #!/bin/sh ip="192.168.3.123" str1=`cat /etc/ntp.conf | grep server` str2="server "$ip" iburst minpoll 3 maxpoll 6" command=s@$str1@$str2@ sed -i "$c

shell 去空格，去掉字符串前后空格（awk、sed 、eval）

猎人在吃肉

06-09

3万+

正则表达式说明： ^\s+ 匹配行首一个或多个空格 \s+$ 匹配行末一个或多个空格 ^\s+|\s+$ 同时匹配行首或者行末的空格 1、awk 去空格方法1： [root@localhost ~]# echo ' A B C ' | awk '{gsub(/^\s+|\s+$/, "");print}' A B C 方法2： [root@linux ~]# echo " A B C " | awk '$1=$1' A B C 2、eval 去空格

Linux删除文件每一行的首尾空格等操作——sed简明教程

kudou1994的博客

09-21

1万+

cat tmp.txt 123456789 123456789 123456789 # 删除每行第一个字符 sed 's/.//' tmp.txt 23456789 23456789 23456789 # 删除每行前两个字符，并保存到tmp2.txt sed 's/..//' tmp.txt &gt; tmp2.txt 3456789 3456789 3456789 # 删除每行前k个字...

关于sed，grep等使用正则表达式中Tab键不能匹配问题的解决

zsmcdut的博客

01-15

1557

发现很多人提出在sed，grep等使用正则表达式中Tab键使用’\t’表示并没有如预期一样匹配上Tab键空格。用‘\t’表示tab键并没有错，但是不是直接用“\t”表示，应该在前面再加一个反斜杠“\”转义“"，即“\t”才是表示转义Tab键“\t”。 ...

提高shell脚本执行效率

dubendi的博客

01-19

1万+

一、先说一下Shell脚本语言自身的局限性作为解释型的脚本语言，天生就有效率上边的缺陷。尽管它调用的其他命令可能效率上是不错的。 Shell脚本程序的执行是顺序执行，而非并行执行的。这很大程度上浪费了可能能利用上的系统资源。 Shell每执行一个命令就创建一个新的进程，如果脚本编写者没有这方面意识，编写脚本不当的话，是非常浪费系统资源的。二、我们在Shell脚本语言的局限性上尽可能的通过我们有

来谈谈关于Shell中效率的问题

weixin_34294649的博客

03-24

243

今天没什么事就总结一下Shell中很多操作关于效率的问题不说别的没有用的就是来点干的最开始那自然就是算数运算这里我最推荐的就是用$(()) 这样的方法进行简单的运算因为无论是expr 还是bc之类的计算器肯定都没有linux的内置的快总结起来也就是一句话那就是能用内置的变量就不要用外部命令然后就是有关于变量截取的问题比如一般的变量都可以用sed来搞定但是的吧，sed说实话效率...

【linux】sed 批量替换 tab替换为空格

xpisme

03-24

3万+

linux下批量替换文件内容

Linux sed命令详解：文本处理大师

总结来说，sed命令是Linux系统中处理文本的强大工具，通过其丰富的动作和正则表达式功能，可以方便地进行文本查找、替换、删除、插入等操作，极大地提高了文本处理的效率。熟练掌握sed命令，对于日常的系统管理和...