版本:
Python:3.6.4 与 2.7.3 均适配
一、hbase表介绍表名:people
列族:basic_info、other_info
rowkey:随机的两位数 + 当前时间戳,并要确保该rowkey在表数据中唯一。
列定义:name、age、sex、edu、tel、email、country。
二、实现rowkey:随机的两位数:使用random.randint(00, 99),然后使用 zfill(2) 补位,比如数字“1”补位为”01”。
生成当前时间的13位时间戳:int(time.time())
rowkey为 随机的两位数 与 时间戳 拼凑而成,并确保rowkey唯一。
name:使用 string.capwords() 将字符串首字母大写,其余字母小写。
使用 random.sample() 截取指定位数的任意字符串 作为 name
age:random.randint(18, 60) :18 ~ 60岁
sex:random.choice()
edu:random.choice()
telphone:random.choice() 与 random.sample() 的联合使用
email:random.sample() 与 random.choice() 的联合使用
country:random.choice()
三、代码
以下为 python 生成 hbase 测试数据的全部代码,generatedata.py 文件内容如