jmeter解析HTML响应,如何使用Jmeter模拟爬虫测试

最新推荐文章于 2023-01-31 19:39:15 发布

别听我说的胡话

最新推荐文章于 2023-01-31 19:39:15 发布

阅读量599

点赞数

文章标签： jmeter解析HTML响应

如何使用Jmeter模拟爬虫测试

在构建Web应用程序负载压力测试时，您可能需要模拟一组用户“抓取”网站并随机单击链接。特别是对于动态网站，如博客，新闻门户，社交网络等，新内容被频繁添加或甚至实时添加。这种形式的测试能确保用户将获得流畅的浏览体验，并检查断开的链接或任何意外错误。

本文介绍了模拟网站“爬网”的3种最常用的方法：点击网页中找到的所有链接、使用HTML链接解析器和高级spidering测试计划。

1.单击网页中找到的所有链接

使用正则表达式提取得到的链接的过程在JMeter的使用正则表达式一文被描述。算法如下：

1a。从响应中提取的所有链接正则表达式提取并将它们存储到JMeter的变量。相关的正则表达式将是：

] * href =“([^”] *)“

不要忘记设置匹配编号No.为-1提取所有的链接。如果将其留空，则只返回第一个匹配项。

1b。

1c。使用HTTP请求取样器点击选择URL，在Output Variable输出变量名中。

演示

优点

配置简单。

稳定性。

故障转移和恢复能力。

缺点

正则表达式很难开发，对标记变化敏感，因此很脆弱。

实际上不是“爬虫”或“蜘蛛”，只是对链接进行请求。

2.使用HTML链接解析器

JMeter的提供了一个特殊的测试元件， HTML解析器的链接。此元素设计用于提取HTML链接和表单，并使用提取的值替换匹配的HTTP请求采样器相关字段。因此，HTML链接解析器可用于模拟使用最少配置抓取网站。方法如下：

2b。把HTTP请求取样器放入逻辑控制器下，配置服务器名称或IP地址和路径字段提取值限制在一个“有趣”的范围。您可能希望专注于属于被测试应用程序的域，并且不希望它在Internet上爬网，因为如果您的应用程序有任何链接到外部资源; JMeter会去外面抓爬。 Perl5风格的正则表达式可以用来设置提取的链接范围。