先说一下,我也不懂怎么做数据库的基准测试或者说压力测试(Stress test),下面都是我个人的经验之谈。
随机数据的生成我使用Python完成,这样就有普遍性,因为大部分数据库都有Python接口。
快速生成随机数看这篇博客:Python 超快生成大量随机数的方法
随机字符串的生成参考这个问答:python - Random string generation with upper case letters and digits - Stack Overflow
我花了一晚上时间生成了800亿行数据,其中一行有2个uint32类型,1个uint8,一个uint16,共4个随机数,以及一个随机的时间。
少量随机数据可以到网上在线生成,比如说: