2024年最新灵魂拷问:读取 excel 测试数据真的慢吗?(2),面试软件测试系统架构

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

而且在 Python 语言当中,内置了 CSV 格式的处理模块,用法非常简单,没有太多额外的学习成本。

import csv

def test_insert_1000_lines_data():    lines = 1000    with open('1000lines.csv', 'w', newline='') as f:        csv_writer = csv.writer(f)        for i in range(lines):            data = (i, f'name{i}', f'http://www.example.com/{i}')            csv_writer.writerow(data)          def test_read_1000_lines_data():    with open('1000lines.csv', newline='') as f:        csv_reader = csv.reader(f)        for row in csv_reader:            print(row)

分别对 1000 行、5 万行和 10 万行数据进行插入和读取操作,CSV 的速度都比 Excel 要快一个量级。

1000 行5 万行10 万行
插入时间0.08s0.09s0.17s
读取时间0.02s0.04s0.09s

对于海量数据处理,CSV 比 Excel 要快很多,代码编写也更简单。

但是,使用 CSV 格式一定要注意对逗号的处理。

在 CSV 当中,每一行的数据默认是用逗号分割的,如果你有一个数据当中本身就包含了逗号,一定要记得把这个数据用双引号包裹。

而且,CSV 支持的数据格式非常有限,数据被读取出来后都被当成字符串,需要自己添加额外的解析操作。

id,17,18,“{‘name’: ‘yuz’, ‘age’: 11}”

现在我也找了很多测试的朋友,做了一个分享技术的交流群,共享了很多我们收集的技术文档和视频教程。
如果你不想再体验自学时找不到资源,没人解答问题,坚持几天便放弃的感受
可以加入我们一起交流。而且还有很多在自动化,性能,安全,测试开发等等方面有一定建树的技术大牛
分享他们的经验,还会分享很多直播讲座和技术沙龙
可以免费学习!划重点!开源的!!!
qq群号:110685036

***03、***最后,看看 YAML 表现怎么样?

YAML 的优点在于丰富的数据类型支持。无论是元组、字典、数字、布尔类型都能支持,并且被 python 语言轻松解析成对应的 python 数据类型。

import yaml

def test_insert_1000_lines_data():    lines = 1000    with open('1000lines.yaml', 'w') as f:        all_data = [{"id": i,                     "name": f"name{i}",                     "data": {"username": "yuz", "passoword": 123456}}                    for i in range(lines)]        yaml.safe_dump(all_data, f)

def test_read_1000_lines_data():    with open('1000lines.yaml',              encoding='utf-8') as f:        data = yaml.load(f, Loader=yaml.SafeLoader

在少量数据的解析上,YAML 会非常的方便。但是一旦数据增加到上万组,YAML 的解析速度会非常非常慢。当数据达到 10 万行的时候,读取速度竟然接近 1 分钟。

1000 行5 万行10 万行
插入时间0.27s14.79s31.78s
读取时间0.47s26.8s53.63s

最近有越来越多的自动化测试人员使用 YAML 存储用例,一方面是看重了它支持的丰富的数据格式,另一方面可能是受了一些框架的影响。

httprunner 这个接口自动化测试框架就采用了 YAML 存储用例数据。其实当存在海量数据需要读取的时候,YAML 的处理速度比 Excel 慢一个量级。

所以 httprunner 这样的框架,从测试效率这个维度来讲,更适合做单用例或者少量用例的测试。如果想针对整个项目甚至是多个项目一次性测试的话,httprunner 的执行速度会比较慢。

***04、***结                论

通过对 Excel、CSV 和 YAML 三种格式的操作效率对比可以得出以下结论。

一、如果你只想对少量的用例进行测试,或者对测试数据的格式要较高的要求,用 YAML 存储用例数据会更利于解析,但是这种场景下一般可以直接使用 postman 这些成熟的工具,没有必要自己实现

二、如果你已经习惯了 Excel 的操作。直接使用这种方式就可以了**,1 万行以下的数据, Excel 还是非常快的**。

三、不管怎么样,我还是更推荐大家去尝试一下 CSV 这种格式。首先、就算是到了 10 万行数据的情况下,它的处理速度也是非常快的。其次,Python 语言当中直接内置了 CSV 的模块,它的使用方式和 open.函数非常的相似,几乎没有额外的学习成本。

最后感谢每一个认真阅读我文章的人,看着粉丝一路的上涨和关注,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走!

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上软件测试知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化的资料的朋友,可以戳这里获取

经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新**

需要这份系统化的资料的朋友,可以戳这里获取

  • 22
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值