大数据应用之 --- ssb-dbgen 部署

本文介绍了如何部署和使用SSB-DBGen,这是一个用于生成大规模数据集的工具。首先从GitHub下载源码,然后在Linux环境中进行编译。编译完成后,通过运行不同参数的dbgen命令生成不同类型的表格数据,如customer、part、lineorder等。最终生成的数据量和记录数分别展示,可用于大数据应用的测试和研究。
摘要由CSDN通过智能技术生成

大数据应用之 — ssb-dbgen 部署

ssb-dbgen

下载源码:

​ https://github.com/vadimtk/ssb-dbgen

​ 下载zip包(下载包比较方便)ssb-dbgen-master.zip,解压并上传至linux

编译

cd /softw/ssb-dbgen-master
make

​ 会在当前目录下生成编译后的文件:

在这里插入图片描述

数据生成

./dbgen -s 40 -T l
./dbgen -s 40 -T p
./dbgen -s 40 -T s
./dbgen -s 40 -T d
./dbgen -s 40 -T c

du -sh *.tbl
126M    customer.tbl
272K    date.tbl
27G     lineorder.tbl
115M    part.tbl
7.4M    supplier.tbl


wc -l *.tbl
    1200000 customer.tbl
       2556 date.tbl
  240012290 lineorder.tbl
    1200000 part.tbl
      80000 supplier.tbl

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值