【ClickHouse为什么这么快?】3. 正则匹配算法 re 和 hyperscan 介绍

本文介绍了正则表达式及其起源,并详细探讨了Intel的Hyperscan库,这是一个高性能的正则表达式匹配库,特别适用于网络设备的DPI/LPS/IDS应用。Hyperscan通过编译期和运行期的工作流程,利用自动机理论和SIMD指令实现高效匹配。此外,文章还提到了Hyperscan的特点、性能优化建议以及与DPDK的整合,强调了其在大规模规则匹配和网络报文处理中的优势。
摘要由CSDN通过智能技术生成

一、什么是正则表达式?

如何匹配特定的字符串?

为了解决这个问题,定义一淘描述字符串特征的的模式, 用于查找、替换符合特征的字符串, 或者用来验证某个字符串是否符合指定的特征——这个模式就是“正则表达式”。

正则表达式最初的想法源于1940年,神经生理学家Waarren McCulloch与Walter Pitts 研究出了一种用数学方式来描述神经网络的模型,他们将神经系统中的神经为元描述成小而简单的自动控制元。

1951年, 数学家Stephen Kleene利用被他称为"正则集合"的数学符号来描述此化模型,这种表达式称为"正则表达式", 正则表达式从此成为现实。之后1968年, UNIX操作系统之父Ken Thhompson将这套符号系统引入了他的文本编辑器qed, 这种编辑器后来成了UNIXed编辑器的基础,并由ed将正则表达式引入了grep。自此以后,正则表込式被广泛地应用到各种UNIX操作系统或类UNIX操作系统中。

正则表达式是一种强大、便捷、高效的文本处理工具,其赋予了了使用者描述和分析文本的能力。从更高的层面上来说,正则表达式允许使用者掌控自己的数据为自己服务"。

掌握正则表达式,就是掌握自己的数据。

二、Hyperscan简介:一款来自Intel的高

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

光剑书架上的书

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值