文章目录
伪数据(Fake Data)
什么是伪数据?顾名思义,亦即假数据,是在真实产品数据无法使用的情况下,产生的接近于产品环境的数据,多用于开发和测试。
正如早前在 CSDN 发布的文章 《想学 pandas 数据分析吗?为你快速生成一份测试数据》 一样,当遇到这样的一个问题时,“使用 Pandas 计算学生成绩相似的 10 个学生”,我们可以采集真实的数据,也可以使用模拟的测试数据,但如果模拟数据是手工造的话,就比较费时费力了,可能会出现诸如“王小明1,王小明2,王小明3”这样的姓名列表。
好在,Python 中有很多第三方库,可以很方便地造出用于测试的伪数据,而且有些还支持中文 。
Python 伪数据生成常生第三方库整理
这里整理了比较常用的伪数据生成第三方库,包括有:
- fake2db - Fake database generator.
- faker - A Python package that generates fake data.
- mimesis - is a Python library that help you generate fake data.
- radar - Generate random datetime / time.
- lipsum - is a simple Lorem Ipsum generator library which can be used in your Python applications.
接着,再来看看这些库的极简使用。
fake2db
这是一个可以给数据库填充伪数据的 Python 库,所支持数据库包括 sqlite, mysql, postgresql, mongodb, redis, couchdb.
安装 fake2db
pip install fake2db
使用 fake2db
--rows argument is pretty clear :) integer
-