第一种方法:使用insert into 插入,代码如下:
1
2
3
4
5
6
7
|
$params</code> <code class="php plain">= </code><code class="php keyword">array</code><code class="php plain">(‘value</code><code class="php string">'=>'</code><code class="php plain">50′);</code></div><div class="line number2 index1 alt1"><code class="php plain">set_time_limit(0);</code></div><div class="line number3 index2 alt2"><code class="php functions">echo</code> <code class="php functions">date</code><code class="php plain">(“H:i:s”);</code></div><div class="line number4 index3 alt1"><code class="php keyword">for</code><code class="php plain">(</code><code class="php variable">$i
=0;
$i</code><code class="php plain"><2000000;</code><code class="php variable">$i
++){
$connect_mysql</code><code class="php plain">->insert(</code><code class="php variable">$params
);
};
echo
date
(“H:i:s”);
|
最后显示为:23:25:05 01:32:05 也就是花了2个小时多!
第二种方法:使用事务提交,批量插入数据库(每隔10W条提交下)最后显示消耗的时间为:22:56:13 23:04:00 ,一共8分13秒 ,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
|
echo
date
(“H:i:s”);
$connect_mysql</code><code class="php plain">->query(‘BEGIN');</code></div><div class="line number3 index2 alt2"><code class="php variable">$params
=
array
(‘value
'=>'
50′);
for
(
$i</code><code class="php plain">=0;</code><code class="php variable">$i
<2000000;
$i</code><code class="php plain">++){</code></div><div class="line number5 index4 alt2"><code class="php variable">$connect_mysql</code><code class="php plain">->insert(</code><code class="php variable">$params</code><code class="php plain">);</code></div><div class="line number6 index5 alt1"><code class="php keyword">if</code><code class="php plain">(</code><code class="php variable">$i</code><code class="php plain">%100000==0){</code></div><div class="line number7 index6 alt2"><code class="php variable">$connect_mysql</code><code class="php plain">->query(‘COMMIT');</code></div><div class="line number8 index7 alt1"><code class="php variable">$connect_mysql</code><code class="php plain">->query(‘BEGIN');</code></div><div class="line number9 index8 alt2"><code class="php plain">}</code></div><div class="line number10 index9 alt1"><code class="php plain">}</code></div><div class="line number11 index10 alt2"><code class="php variable">$connect_mysql
->query(‘COMMIT');
echo
date
(“H:i:s”);
|
第三种方法:使用优化SQL语句:将SQL语句进行拼接,使用 insert into table () values (),(),(),()然后再一次性插入,如果字符串太长,
则需要配置下MYSQL,在mysql 命令行中运行 :set global max_allowed_packet = 2*1024*1024*10;消耗时间为:11:24:06 11:25:06;
插入200W条测试数据仅仅用了1分钟!代码如下:
1
2
3
4
5
6
|
$sql</code><code class="php plain">= “insert into twenty_million (value) values”;</code></div><div class="line number2 index1 alt1"><code class="php keyword">for</code><code class="php plain">(</code><code class="php variable">$i
=0;
$i</code><code class="php plain"><2000000;</code><code class="php variable">$i
++){
$sql</code><code class="php plain">.=”('50′),”;</code></div><div class="line number4 index3 alt1"><code class="php plain">};</code></div><div class="line number5 index4 alt2"><code class="php variable">$sql
=
substr
(
$sql</code><code class="php plain">,0,</code><code class="php functions">strlen</code><code class="php plain">(</code><code class="php variable">$sql
)-1);
$connect_mysql</code><code class="php plain">->query(</code><code class="php variable">$sql
);
|
最后总结下,在插入大批量数据时,第一种方法无疑是最差劲的,而第二种方法在实际应用中就比较广泛,第三种方法在插入测试数据或者其他低要求时比较合适,速度确实快。
三个要点:
1、组合sql,组成如insert into table(…) values(…)(…)(..)。但注意,values后面的记录数不能太多,每次大约10000条就差不多了(这个数字不太精确)。
2、开启mysql事务,避免自动提交
3、对数据做处理,做到数据有序的插入,数据有序的插入是指插入记录在主键上是有序排列
注意事项:
1. SQL语句是有长度限制,在进行数据合并在同一SQL中务必不能超过SQL长度限制,通过max_allowed_packet配置可以修改,默认是1M,测试时修改为8M。
2. 事务需要控制大小,事务太大可能会影响执行的效率。MySQL有innodb_log_buffer_size配置项,超过这个值会把innodb的数据刷到磁盘中,这时,效率会有所下降。所以比较好的做法是,在数据达到这个这个值前进行事务提交。
转:http://www.jb51.net/article/51975.htm