java 链接mysql 产生500W数据模拟生成环境

20 篇文章 0 订阅
7 篇文章 0 订阅

java 插入数据到mysql 通过sqoop 导入到hive 中,kylin模拟见cube 时间和 数据膨胀率 kylin 数据插入到 HBase

Kylin

HBase 1.1.3

Hive 1.2.1

Hadoop 2.5.1


create table infoagetime(
prod_name char(10),
prod_id SMALLINT,
ods_date DATE
)

数据格式

oPmgBZxldW    75    2016-09-04
WSSAnnZrNy    57    2016-09-09


本人Java水平有限,大家自行改善,尤其是批量插入mysql语句


另工程中需要导入 mysql jar :   mysql-connector-java-5.1.6.jar

V2

package com.wubaiwan.instmysql;

import java.io.File;
import java.io.FileOutputStream;
import java.sql.DriverManager;
import java.util.Random;

public class YiBaiWan {

	public static String getRandomString(int length) { // length表示生成字符串的长度
		String base = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";
		Random random = new Random();
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < length; i++) {
			int number = random.nextInt(base.length());
			sb.append(base.charAt(number));
		}
		return sb.toString();
	}

	public static final String url = "jdbc:mysql://192.168.184.168/hive2";
	public static final String name = "com.mysql.jdbc.Driver";
	public static final String user = "root";
	public static final String password = "123";

	public static java.sql.Connection conn = null;
	public static java.sql.PreparedStatement pst = null;
	static FileOutputStream out = null;

	public static void main(String args[]) {

		try {
			Class.forName(name);
			conn = DriverManager.getConnection(url, user, password);// 获取连接
			conn.setAutoCommit(false);
		} catch (Exception e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		} // 指定连接类型

		

		Random random = new Random();
		// int k = random.nextInt();
		// System.out.println(k);
		int x = 0;
		try {
			out = new FileOutputStream(new File("D:/mysql.txt"));
			String sql = "insert into infoagetime(prod_name,prod_id,ods_date) values(?,?,?)";
			// System.out.println(sql);
			pst = conn.prepareStatement(sql);

			while (x < 5000000) {
				// System.out.println((int)(Math.random()*100));
				// System.out.println(getRandomString(10) + ',' +
				// (int)(Math.random()*100));
				// String k = getRandomString(10) + ',' +
				// (int)(Math.random()*100 )+ ','+ "2016-09-0" +
				// (int)(random.nextInt(9)%9 + 1)+"\r\n" ;
				// System.out.println(k);
				// out.write(k.getBytes());

				pst.setString(1, getRandomString(10));
				pst.setInt(2, (int) (Math.random() * 100));
				pst.setString(3, "2016-09-0" + (int) (random.nextInt(9) % 9 + 1));

				pst.addBatch();

				if (x % 1000 == 0) {
					pst.executeBatch();
					//pst.executeUpdate(arg0)
				}

				x++;
			}
			System.out.println("Commit");
			pst.executeBatch();
			conn.commit();
			out.close();
			conn.close();
			pst.close();
			
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}finally{
			
			
		}
		
		

	}

}



======================================

V1  这个版本会有java memory 异常

package com.wubaiwan.instmysql;

import java.io.File;  
import java.io.FileOutputStream;
import java.sql.DriverManager;
import java.util.Random;
 
public class YiBaiWan {  
      
      
    public static String getRandomString(int length) { //length表示生成字符串的长度      
           String base = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";         
           Random random = new Random();         
           StringBuffer sb = new StringBuffer();         
           for (int i = 0; i < length; i++) {         
               int number = random.nextInt(base.length());         
               sb.append(base.charAt(number));         
           }         
           return sb.toString();         
        }    
      
    public static final String url = "jdbc:mysql://192.168.184.168/hive2";    
    public static final String name = "com.mysql.jdbc.Driver";    
    public static final String user = "root";    
    public static final String password = "123";    
      
    public static java.sql.Connection conn = null;    
    public static java.sql.PreparedStatement pst = null;    
      
    public static void main(String args[]){  
          
        try {
			Class.forName(name);
			conn = DriverManager.getConnection(url, user, password);//获取连接 
		} catch (Exception e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}//指定连接类型   
           
        FileOutputStream out = null;     
          
        Random random = new Random();  
        //int k = random.nextInt();  
        //System.out.println(k);  
        int x = 0;  
        try {  
            out = new FileOutputStream(new File("D:/mysql.txt"));  
          
          
        while(x <5000000){  
            //System.out.println((int)(Math.random()*100));  
            //System.out.println(getRandomString(10) + ',' + (int)(Math.random()*100));  
            //String k = getRandomString(10) + ',' + (int)(Math.random()*100 )+ ','+ "2016-09-0" + (int)(random.nextInt(9)%9 + 1)+"\r\n" ;  
            //System.out.println(k);  
            //out.write(k.getBytes());  
            String sql = "insert into infoagetime(prod_name,prod_id,ods_date) values('"+getRandomString(10)+ "',"+(int)(Math.random()*100 )+","+ "'2016-09-0" + (int)(random.nextInt(9)%9 + 1) + "')"   ;
            //System.out.println(sql);
            pst = conn.prepareStatement(sql);  
            pst.executeUpdate();  
            if(x%10000 == 0 ) {
                System.out.println("Commit");
                conn.commit();
            }
            x++;  
            }   
        out.close();    
        conn.close();   
        pst.close();  
        }catch (Exception e) {  
                // TODO Auto-generated catch block  
                e.printStackTrace();  
            }  
          
           
  
    }  
  
}  


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Jmockdata(再也不用苦逼的造测试数据了) Jmockdta是一款实现模拟JAVA类型或对象的实例化并随机初始化对象的数据的工具框架。单元测试的利器。     The plug-in of Jmockdata what through random algorithm mock java data.   Jmockdata插件通过随机算法模拟Java数据.   版本信息 Jmockdata-2.0 发布时间 2017-02-03 Jmockdata-1.0 发布时间 2017-01-04 具体介绍和用法可以参考如下:   0. 模拟数据入口方法 JMockData.mock(JmockDataWrapper) 1. 被模拟数据必须继承JmockDataWrapper经过它的包装 2. 被模拟数据最好是plain bean,只提供getter,setter,has,is方法的才可以被模拟 3. 框架默认实现了40个元数据类型的数据模拟器包括:   byte.class,Byte.class,byte[].class,Byte[].class, short.class,Short.class,short[].class,Short[].class, int.class,Integer.class,int[].class,Integer[].class, long.class,Long.class,long[].class,Long[].class, float.class,Float.class,float[].class,Float[].class, double.class,Double.class,double[].class,Double[].class, boolean.class,Boolean.class,boolean[].class,Boolean[].class, char.class,Character.class,char[].class,Character[].class, String.class,String[].class, BigDecimal.class,BigDecimal[].class, BigInteger.class,BigInteger[].class, Date.class,Date[].class 通过对以上基本元数据类型的模拟实现,本框架可以轻松模拟由以上元数据结构组成的BEAN、LIST、SET、ARRAY等复杂深度的数据结构的数据模拟。   4. 可以通过JmockDataContext 获取模拟过程的所有上下文信息,甚至可以打印整个模拟类型树   5. 可以通过JMockDataManager 注册模拟数据类型,重写模拟数据算法,注册模拟数据类拦截器等 6. 可以通过实现MockData来实现一个模拟数据类型 7. 可以通过实现JmockDataTemplate,或者继承JmockDataTemplateDefault来重写模拟数据算法 8. 可以通过实现JmockDataInterceptor来实现一个拦截器 9. 具体示例实践请参考https://github.com/jsonzou/jmockdata-demo 10. 有问题或者对本框架有新的想法,请联系我, 作者:jsonzou 标签:Jmockdata
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值