linux 多路cpu支持,在Linux命令中使用多个CPU核心

cat bigfile.bin | bzip2 --best > compressedfile.bz2

而改为

cat bigfile.bin | parallel --pipe --recend '' -k bzip2 --best > compressedfile.bz2

特别对于bzip2命令,

GNU Parallel在多核CPU上显著地快于单核。你一不留神,它就执行完成了。

GREP

如果你有一个超大的文本文件需要被检索,那么就不应该这样使用:

grep pattern bigfile.txt

而是

cat bigfile.txt | parallel --pipe grep 'pattern'

抑或是

cat bigfile.txt | parallel --block 10M --pipe grep 'pattern'

第二条命令使用了--block 10M参数,通过这个参数可以表示你希望每个CPU核心处理多少行数据。

AWK

这里有一个如何使用awk来计算一个非常大的文件的例子,原来我们使用:

cat rands20M.txt | awk '{s+=$1} END {print s}'

而现在:

cat rands20M.txt | parallel --pipe awk \'{s+=\$1} END {print s}\' | awk '{s+=$1} END {print s}'

这里面用到了更多的东西。在parallel中的-pipe参数将cat的输出分成多个块传递给awk,形成许多子操作计算,这些子计算结果通过第二个管道传给同一个的awk,然后给出最终结果。第一个awk有三个反斜线,这是为了GNU Parallel调用awk的需要。

WC

想要使用超级并行来计算一个文件的行数吗?那么就不要再这样使用了:

wc -l bigfile.txt

而是:

cat bigfile.txt | parallel --pipe wc -l | awk '{s+=$1} END {print s}'

这是一种相当巧妙的方法:我们先映射出大量的wc -l的调用,生成子运算,

然后通过第二个管道传给awk,

把它们加起来。

SED

想要使用sed在一个极大的文件中做大量替换么?那么就不应该这样使用:

sed s^old^new^g bigfile.txt

而是

cat bigfile.txt | parallel --pipe sed s^old^new^g

... ... 然后可以使用pipe把输出存储到指定的文件中。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: poll机制是Linux驱动一种用于实现I/O多路复用的机制。在使用poll机制时,驱动程序可以在多个文件描述符上同时等待可读、可写或异常事件的发生,从而避免了在相应的文件描述符上使用阻塞IO时CPU周期的浪费。poll机制的主要思路是向内核注册多个文件描述符,内核会将这些文件描述符上的I/O事件传递给用户程序,用户程序能够根据得到的事件类型继续执行下去。 ### 回答2: poll机制是Linux驱动程序实现异步输入输出操作的一种方法,通过这种机制,驱动程序可以将不同的设备进行组合,从而实现对这些设备进行统一的轮询操作。 在使用poll机制时,驱动程序需要提供一个poll方法,在该方法,通过向用户空间返回一个特殊的文件描述符来表示设备状态的变化,然后用户空间通过读取这个描述符来判断设备是否有数据到达。如果有数据到达,用户空间再调用相应的读取方法来读取这些数据,从而实现异步读写。 在实现poll机制时,驱动程序通常需要调用内核提供的一些API接口,如file_operations结构体的poll方法、wait_queue_head_t结构体、poll_table结构体等。 在使用poll机制时,用户空间可以通过调用poll函数来注册设备文件,并设置等待事件。当设备的状态改变时,内核会将读取操作挂起,并返回一个特殊的文件描述符。此时,用户空间可以通过调用相应的读取函数来读取数据,在读取完毕后,再次通过poll函数注册设备文件,等待下一次事件处理。 总之,poll机制可以帮助驱动程序实现异步输入输出操作,同时也可以帮助应用程序进行事件处理,提高了Linux的应用程序的可靠性和效率。 ### 回答3: poll机制是Linux内核提供的多路复用机制之一,它使得一个进程可以监视多个文件描述符上的读写情况。在进程需要同时监听多个文件描述符的读写情况时,若采用传统的阻塞式I/O方式,就需要使用多个线程或进程来处理,这种方式会导致系统资源的浪费。因此,poll机制的使用,避免了上述情况发生。 poll机制最常用于网络编程。在一个服务器程序,可能需要同时监听多个客户端的连接请求。使用poll机制可以将这些客户端的连接描述符放入一个pollfd数组,同时对这个数组进行监听,以便及时处理。 poll的基本原理是:进程调用poll系统调用时,内核会挂起该进程,直到poll所监听的文件描述符有读写事件发生时,内核会唤醒进程,通过返回值告知进程哪些文件描述符发生了事件,并将该事件信息写入对应的pollfd结构体。这样,进程就可以根据返回的信息对文件描述符进行相应的操作。 poll机制存在以下优点: 1.单个进程可以同时监视多个文件描述符的读写情况,可以更好的利用CPU资源。 2.和select相比,poll没有描述符数量限制,select有FD_SETSIZE的限制。 3.poll在内核将打开文件描述符的等待队列挂起,直到设备就绪,因此在多处理器系统poll的性能要优于select。 4.使用poll不需要重新初始化文件描述符,不需要进行文件描述符拷贝操作。这使得poll的使用比较方便。 总之,poll机制是Linux系统非常重要的一个多路复用机制,它极大地提高了系统的效率和可用性。在进行网络编程时,我们常常需要使用poll机制来提高代码的性能和实用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值