1.TPC-DS下载地址如下
http://www.tpc.org/tpc_documents_current_versions/current_specifications.asp
1.安装依赖
yum-y install gcc gcc-c++ libstdc++-devel bison byacc flex
2.安装
unzip a3083c5a-55ae-49bc-8d6f-cc2ab508f898-tpc-ds-tool.zip
cd v2.3.0/tools
make
3.生成数据
生成10T数据
./dsdgen -scale10000-dir /dfs/data
后台生成数据
100G数据生成(可以不同机器同时生产秩序改并行度和child后面的数字,注意并行度你自己调整,例如我这里是10,那么就要保证有10个child才能保证数据后续是完整的。)
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 1 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 2 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 3 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 5 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 6 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 7 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir/dfs/data/ -parallel 10 -child 8 >nohup.log 2>&1 &
noh