js 动态拼接html 正则,采用正则匹配抓取JS动态输出的电话号码

最新推荐文章于 2024-04-28 00:00:00 发布

weixin_39669204

最新推荐文章于 2024-04-28 00:00:00 发布

阅读量206

点赞数

文章标签： js 动态拼接html 正则

很多网站为了防止用户的隐私信息(电话、手机、邮箱)被爬虫抓取，都对这些信息作了特殊处理后输出。例如，采用JS输出、采用Ajax方式动态加载、以图片的形式显示。

其中最常见的就是采用JS输出，这种方法实现的成本最低，同样也最好被抓取。

例如下面这个页面：

它的电话号码部分是采用JS输出的，JS代码如下：

更BT的是这个函数名“escramble_751()”还是不断变化的。

不过利用强大的字符串匹配工具“正则表达式”，还是可以很方便地将其提取出来的：

# code by Python

phone_re = re.compile("a='([ \+\-\d]+?)'.*?b='([ \+\-\d]+?)'.*?a\+='([ \+\-\d]+?)'.*?b\+='([ \+\-\d]+?)'.*?c='([ \+\-\d]+?)'", re.DOTALL)

match = phone_re.search(html)

if match:

a, b, c, d, e = match.groups()

telephone = a + c + e + b + d

else:

telephone = None

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39669204

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例

杨秀璋的专栏

09-30

2万+

欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家。第四篇文章将开启网络爬虫之旅，首先介绍基础知识及正则表达式的爬虫，希望对您有所帮助，文章中不足之处也请海涵。

正则获取图片地址链接地址

10-30

例如，过于简单或宽松的正则表达式可能会错误地匹配到不应该匹配的文本，如javascript代码中的"src="，这可能会导致安全问题或数据丢失。在应用正则表达式进行网络资源地址提取时，应该根据实际情况设计合适的正则...

参与评论您还未登录，请先登录后发表或查看评论

js动态拼接正则表达式的两种方法

12-02

方法一：做项目的时候可能会遇到用js验证表单输入正确性的需求，这时候就需要用到js的正则表达式。举个例子：比如说要验证月份，格式为：’yyyy-MM’，这个正则表达式写起来很简单，实在写不出，也可以Google、百度一把，网上例子一大堆！但是js正则表达式就这样写死也会带来新的问题：如果配置文件的月份格式改了呢？改成’yyyyMM’、或者是’yyyy_MM’…呢？？我们是不是要记得去把js中的正则表达式也跟着一遍遍的改呢？？这时候我们就要问了：怎样才能写出动态的正则表达式呢，修改了配置文件，就不需要再去动代码了呢？笔者翻阅了js手册，没有找到将字符串转换成正则表达式的方法，但是可以用ev

html中js正则表达式手机,js最新手机号，正则表达式|前端开发博客

weixin_39962675的博客

05-31

323

正则表达式是描述字符模式的对象. 使用正则表达式执行功能强大的模式匹配以及文本检索和替换功能.常规ID://正则表达式(15位)isIDCard1=/^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$/;//正则表达式(18位)isIDCard2=/^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\...

js 正则表达式动态参数匹配

YuShiYue的博客

01-06

5193

比如说我们要做一个加减乘除的计算，但是表达式都是用户自己设计的，参数也都是动态的，这个时候一般就要考虑到匹配，比如还牵扯到主表，子表，会有字段重复问题(表不一样，字段是允许重复的)，这个时候我们就需要使用到动态匹配正则了。 const obj = { k1: 20, k2: 10 } let str = '{#k1}*0.8/{#k2}*100+{#k1}' // 方式一 Obje...

js动态拼接正则

weixin_34293902的博客

07-29

1481

为什么80%的码农都做不了架构师？>>> ...

利用正则表达式抓取博客园列表数据

10-23

首先，为了抓取博客园的列表数据，需要创建一个正则表达式进行匹配。正则表达式工具有很多，例如Regulator，这个工具可以帮助我们拼接出所需的正则表达式，并在编写代码时使用。博客园的列表数据可以通过直接访问...

PHP基于正则批量替换Img中src内容实现获取缩略图的功能示例

12-20

此外，文章还提到了两款在线正则表达式测试工具，分别是JavaScript正则表达式在线测试工具和正则表达式在线生成工具，这些工具可以帮助开发者测试和创建正则表达式，以确保它们能按预期工作。总的来说，通过理解和...

JS拼接正则表达式用RegExp动态拼接正则

这是个什么博客

12-14

3209

JS拼接正则表达式，用RegExp动态拼接正则，变量拼接

JS中正则使用

xiojing的博客

09-27

321

正则匹配判断字符串是否含有 test 直接量方式.需要斜线包裹,无需引号,无需转义符 var reg = /^\S*test\S*$/; var str = 'atestbb'; console.log(reg.test(str) ); //true2.构造函数.无需斜线包裹,使用\S ,\d等通配符时需要转义符,可使用变量拼接. var spellName

JavaScript实现手机号码 3-4-4格式,并控制新增和删除时光标的位置

youngjqz的博客

06-01

842

JavaScript实现手机号码 3-4-4格式手机号实现3-4-4格式相对来说还是比较简单的，监听input事件，实时的获取手机号码，然后根据手机号码的长度做截取和拼接的操作，即可实现手机格式的处理，实现格式的处理之后，我们还需要支持在指定光标进行新增和删除 // An highlighted block <input ref="inputRef" class="life-input" v-model="value"

JS 合并拼接字符串（ 5种方法）

最新发布

大剑师兰特的GIS世界

04-28

4534

- **加号 (+)**：简单易用，但可能影响代码可读性和性能。 - **模板字面量**：简洁直观，支持多行和嵌入表达式，是现代JavaScript中最推荐的拼接方式。 - **`concat()`**：功能较弱，不如其他方法灵活，较少使用。 - **数组 `join()`**：适用于拼接大量字符串，性能较好，但需预先收集到数组中。 - **`replace()`** 结合空正则表达式：特殊场景下的优化手段，一般不推荐常规使用。

js最新手机号码、电话号码正则表达式

Mr_chen的博客

12-04

5387

JavaScript/JS 中，如何连接两个正则表达式 RegExp

YopenLang的博客

07-12

3361

JavaScript 的正则表达式可以用两种表达方式：这两种表达式等价。JS 正则有两个属性，和会输出它的标志，则输出它的正则匹配串。利用这两个属性，就可以去拼接两个正则： 💥 注意需要去重，不然构造函数会抛出错误。[1] How to Concatenate a Regular Expression......

js 动态拼接正则表达式

tdl081071tdy的博客

10-26

7118

在js中很多时候我们都需要使用正则比如这里我利用正则查找字符 a 后面跟着一个或多个空格的内容，我们便可以这么做 let str = "abcdefa aab bb" let reg = /a\s.*/ console.log(reg.exec(str)) 但如果我们把条件改了，我们要查找字符b后面跟着一个或多个空格的内容，那我们不可能去再重新写一个正则这是我们便可以动态的去拼接正则，再js中不能直接使用常规的字符串拼接方式来拼接，它必须使用eval来进行拼接 let str =.

JS将手机号中间四位变为****的四种方式

qq_41409353的博客

06-09

4295

【需求】小程序，H5， PC的用户信息展示时需要对用户的电话号码进行加密处理，其中常见的做法是将中间四位数字变成 **** ，下边有四种办法 1. 正则表达式【推荐】 let tel = '18000010001' tel.replace(/(\d{3})\d{4}(\d{4})/, "$1****$2") console.log(tel) 2. 利用数组splice，split，join方法 let tel = '18000010001'; let tempArray = tel.split("")

JS生成动态正则表达式

Fitz的博客

09-27

7675

JS生成动态正则表达式 js里面常见的正则格式是var reg = /^abc$;,但是这里面是无法加入动态字符串的。，所以经过搜索发现RgeExp这个函数，然后测试了一下，发现原来这样就可以动态生成正则表达式了 keyWords = ['virtual','vi','mo','mobile','qwert']; for (let i = 0; i < keyWords.length; i++) { if (keyWords[i] !== '') { l

JS——动态正则

spfLinux的博客

11-16

3427

var names = ["明月","紫烟","青天","白鹭"]; var str = "窗前明月光，日照香炉生紫烟，一行白鹭上青天"; //var kwords = str.match(/明月|紫烟/g); //可以 //var kwords = str.match(/names.join("|")/g); //不可以的 var reg = new RegExp(names.