mysql数据库加权随机_mysql – 如何在考虑权重的情况下随机选择...

本文探讨了在MySQL中如何实现加权随机选择记录的方法,包括使用van的解决方案和维护辅助表的方式。针对效率问题,文章指出当选择速度至关重要时,使用辅助表的方式能显著提高查询速度。
摘要由CSDN通过智能技术生成

我已经尝试过van的解决方案,虽然它有效,但它并不快.

我的解决方案

我解决这个问题的方法是为权重维护一个单独的链接表.基本表结构与此类似:

CREATE TABLE `table1` (

`id` int(11) UNSIGNED AUTO_INCREMENT PRIMARY KEY,

`name` varchar(100),

`weight` tinyint(4) NOT NULL DEFAULT '1',

);

CREATE TABLE `table1_weight` (

`id` bigint(20) UNSIGNED AUTO_INCREMENT PRIMARY KEY,

`table1_id` int(11) NOT NULL

);

如果我在table1中有一个权重为3的记录,那么我在table1_weight中创建3条记录,通过table1_id字段链接到table1.无论表1中的权重值是多少,这就是我在table1_weight中创建的链接记录数.

测试

在table1中有976条记录的数据集中,总权重为2031,因此table1_weight中有2031条记录,我运行了以下两个SQL:

> van解决方案的一个版本

SELECT t.*

FROM table1 t

INNER JOIN

( SELECT t.id,

SUM(tt.weight) AS cum_weight

FROM table1 t

INNER JOIN table1 tt ON tt.id <= t.id

GROUP BY t.id) tc ON tc.id = t.id,

( SELECT SUM(weight) AS total_weight

FROM table1) tt,

( SELECT RAND() AS rnd) r

WHERE r.rnd * tt.total_weight <= tc.cum_weight

ORDER BY t.id ASC

LIMIT 1

>加入辅助表进行加权

SELECT t.*

FROM table1 t

INNER JOIN table1_weight w

ON w.table1_id = t.id

ORDER BY RAND()

LIMIT 1

SQL 1始终持续0.4秒.

SQL 2需要0.01到0.02秒.

结论

如果选择随机加权记录的速度不是问题,则van建议的单表SQL很好,并且没有维护单独表的开销.

如果,在我的情况下,短的选择时间是关键的,那么我会建议两个表方法.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值