python 正则表达式生成_Python库生成正则表达式

有没有任何lib可以采取文本(如html文档)和字符串列表(如某些产品的名称),然后在字符串列表中找到一个模式,并生成一个正则表达式,将提取所有的文本中的字符串(html文档)匹配它发现的模式?

例如,给出以下html:

Product 1

Product 2

Product 3

Product 4

Product 5

Product 6

Product 7

Product 8

和以下字符串列表:

['Product 1', 'Product 2', 'Product 3']

我想要一个可以构建正则表达式的函数,如下所示:

'

(.*?)'

然后从与正则表达式匹配的html中提取所有信息.

在这种情况下,输出将是:

['Product 1', 'Product 2', 'Product 3', 'Product 4', 'Product 5', 'Product 6', 'Product 7', 'Product 8']

澄清:

我想要这个功能来查看样品的周围,而不是样品本身.

所以,例如,如果html是:

Word

More words

101

-1-0-1-

和样品[‘Word’,’More words’]我想要提取:

['Word', 'More words', '101', '-1-0-1-']

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值