最近有个特别变态的业务需求,有一张表
CREATE TABLE `demo` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`tid` int(11) DEFAULT '0',
`pid` int(11) DEFAULT '1',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3000124 DEFAULT CHARSET=utf8;
大概就是这样,有300多万行记录,每个pid记录的这个ID的最顶级分类,tid是它的上级分类!
现在需求是:通过指定一个ID,查找出它的所有子集成员,并修改这个pid的值为新指定的值!!
在PHP中跑了一下,执行时间大概需要50秒+,很是痛苦!!!
需要递归找出所有子集,修改它的pid,工作量还是蛮大的。
而oracle中有一个方法是connect_by_isleaf,可以很方便的找出所有子集,但我是MySQL......
所以用这儿简单的写写用MySQL的方法或存储过程实现的经验
第一种:MySQL的方法
CREATE DEFINER=`root`@`localhost` FUNCTION `lvtao_demo_a`(rootId int) RETURNS text CHARSET utf8
READS SQL DATA
COMMENT 'demo'
BEGIN
DECLARE sTemp text;
DECLARE sTempChd text;
SET sTempChd =cast(rootId as CHAR);
SET sTemp = '';
WHILE sTempChd is not null DO
SET sTemp = concat(sTemp,',',sTempChd);
SELECT group_concat(id) INTO sTempChd FROM demo where FIND_IN_SET(tid,sTempChd)>0;
END WHILE;
RETURN sTemp;
END;
使用方法就是
select lvtao_demo_a(5);
但我在测试的时候,300万的数据基本上就是崩溃!!!
Data too long for column 'sTemp' at row 1
优点: 简单,方便,没有递归调用层次深度的限制 (max_sp_recursion_depth,最大255) ;
缺点:长度受限。
第二种:存储过程+中间表
DELIMITER ;;
CREATE DEFINER=`root`@`localhost` PROCEDURE `sss`(IN pid int, IN rootid int)
BEGIN
DECLARE done INT DEFAULT FALSE;
DECLARE id TEXT;
DECLARE cur1 CURSOR FOR SELECT id FROM demo WHERE tid=pid;
DECLARE CONTINUE HANDLER FOR NOT FOUND SET done = TRUE;
set max_sp_recursion_depth = 200;
OPEN cur1;
read_loop: LOOP
FETCH cur1 INTO id;
IF done THEN
LEAVE read_loop;
END IF;
INSERT INTO temp (rootid,zid) values (rootid, id);
call sss(id,rootid);
END LOOP;
CLOSE cur1;
END;;
DELIMITER ;
哈哈,300万数据也卡成球了~~~
再想办法吧~~~~不折腾了