【AI测试】也许这有你想知道的人工智能 (AI) 测试--开篇

人工智能测试

什么是人工智能,人工智能是怎么测试的。可能是大家一开始最想了解的。640?wx_fmt=png 让机器实现原来只有人类才能完成的任务;比如看懂照片,听懂说话,思考等等。

举个例子,把 人工智能 比做 水果。如果有人问你 “水果是怎么吃的”,你可能不知道怎么回答。

  • 机器学习项目怎么测试

  • 推荐系统项目怎么测试

  • 图像识别项目怎么测试

  • 自然语言处理项目怎么测试。

目前应用最广泛的人工智能也是这四个类型。

刚刚把人工智能比作水果,我们知道,吃水果的方法有很多。可以把机器学习比作 一种吃水果的方法。如果用刀切这种方法。深度学习又是机器学习的一个分支。大概的关系图如图中显示。640?wx_fmt=png

测试什么

一般这些项目都要测试什么,要进行什么类型的测试。

1. 模型评估测试

2. 稳定性/鲁棒性测试

3. 系统测试

4. 接口测试

5. 文档测试

6. 性能测试

7. 白盒测试–代码静态检查

8. 竞品对比测试

9. 安全测试

发布上线后,线上模型监控


测试数据

不管是机器学习,推荐系统,图像识别还是自然语言处理,都需要有一定量的测试数据来进行运行测试。

上线只是完成了一半测试,并不像APP或者WEB网站测试一样,测试通过后,发布到正式环境,测试工作就完成了。

  • 测试集独立同分布

  • 测试数据的数量和训练数据的比例合理

测试集独立同分布

测试数据的数量和训练数据的比例合理

如果数据量是百万级别,那么验证集和测试集占数据总量的比例会趋向于变得更小。如果拥有百万数据,我们只需要1000条数据,便足以评估单个分类器,并且准确评估该分类器的性能。假设我们有100万条数据,其中1万条作为验证集,1万条作为测试集,100万里取1万,比例是1%,即:训练集占98%,验证集和测试集各占1%。对于数据量过百万的应用,训练集可以占到99.5%,验证和测试集各占0.25%,或者验证集占0.4%,测试集占0.1%。640?wx_fmt=jpeg

一般算法工程师会将整个数据集,自己划分为训练集、验证集、测试集。或者训练集、验证集 等等。(这里的测试集是算法工程师的测试数据)

测试用例思考点

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值