最新消息:觉得本站不错的话 记得收藏哦 博客内某些功能仅供测试 讨论群:135931704 快养不起小站了 各位有闲钱就打赏下把 My Email weicots#gmail.com Please replace # with @

Mysql 随机查询优化

LINX-SQL ajiang-tuzi 5951浏览

某一项目需要用到随机查询
我用了个这个

SELECT * FROM `table` ORDER BY RAND() limit 10

发现 通各种 查询 索引 块缓存 控制在毫秒内的速度 一下子蹦到4S 秒以上
所以就不得不研究下 随机查询

一、随机查询一条数据

方法一:

SELECT * FROM `table` ORDER BY RAND() limit 1

评价:不建议使用,效率非常低,官方文档中进行说明:Order By和RAND()连用,会多次扫描表,导致速度变慢。
方法二:

SELECT * FROM `table` 
WHERE id >= (
SELECT floor(RAND() * (
SELECT MAX(id) FROM `table`)))  
ORDER BY id LIMIT 1;

解释:

SELECT MAX(id) FROM `table` #这句话查询出最大的id值 
SELECT floor(RAND() * (
SELECT MAX(id) FROM `table`)) #这句获取一个小于MAX(id)的随机数
WHERE id >= (SELECT floor(RAND() * (
SELECT MAX(id) FROM `table`))) #这句话筛选出所有的大于生成随机数的id的行

然后最后就把大于这个随机id的行查询出来,
然后按照id排序,选择第一个,就相当与获取了所有行中随机的一行。
评价:有问题,如果id不是从0开始的话,比如从10000开始自增,那么

 SELECT floor(RAND() * (SELECT MAX(id) FROM `table`)) 

得到的将是会有很大概率得到小于10000的值,
经过where限定的查询结果将会是所有的查询结果的几率变大,
最后limit 1获取的是第一行数据的几率变高。
方法三:

SELECT * FROM `table` 
WHERE id >= (
SELECT floor( RAND() * ((
SELECT MAX(id) FROM `table`)-(
SELECT MIN(id) FROM `table`)) + (
SELECT MIN(id) FROM `table`)))  
ORDER BY id LIMIT 1;

方法四:

SELECT * 
FROM `table` AS t1 JOIN (
SELECT ROUND(RAND() * ((
SELECT MAX(id) FROM `table`)-(
SELECT MIN(id) FROM `table`))+(
SELECT MIN(id) FROM `table`)) AS id) AS t2 
WHERE t1.id >= t2.id 
ORDER BY t1.id LIMIT 1;

评价:解决了方法二中MAX(id)的问题,

RAND() * ((
SELECT MAX(id) FROM `table`)-(
SELECT MIN(id) FROM `table`)) + (
SELECTMIN(id) FROM `table`)

可以
获取MAX(id)和MIN(id)中的随机数。

方法四要比方法三稍快一点,
mysql随机查询若干条数据
这篇博客指出,15w条数据前者花费时间 0.147433 秒,后者花费时间 0.015130 秒。
以上解决方案都默认有一个不重复的数字字段,其实现在很多表的设计都是以一个自增段作为主键,
当然还有一些是以uuid作为主键的,而没有数字键,这样的话,
可以用MySQL的函数将uuid的字符串转换成数字。而且还有一个问题,
如果id字段的数字分布不均匀的话(比如按照1,4,5,6,7,8,45这样分布),也会造成随机查
询的不合理,但是这里就不讨论那么复杂的问题了。

二、随机查询多条数据

方法一:把随机查询一条数据的limit
1修改成limit 5
评价:这样获取的数据会是连续的。
方法二:

SELECT * 
FROM `table` AS t1 JOIN (
SELECT ROUND(RAND() * ((
SELECT MAX(id) FROM `table`)-(
SELECT MIN(id) FROM `table`))+(
SELECT MIN(id) FROM `table`)) AS id 
from `table` limit 50) AS t2 on t1.id=t2.id
ORDER BY t1.id LIMIT 1;

解释:

SELECT ROUND(RAND() * ((
SELECT MAX(id) FROM `table`)-(
SELECT MIN(id) FROM `table`))+(
SELECT MIN(id) FROM `table`)) AS id 
from `table` limit 50)

这样会获取50个随机数字,然后on
t1.id=t2.id会挑选出不大于50行的随机数据,然后取5条就好了。

最终SQL

SELECT *
FROM `movie_info` AS t1 JOIN (
SELECT ROUND(RAND() * (
(SELECT MAX(id) FROM `movie_info`)-
(SELECT MIN(id) FROM `movie_info`)
)+
(SELECT MIN(id) FROM `movie_info`)
) AS id
from `movie_info` limit 50) AS t2 on t1.id=t2.id
ORDER BY t1.id LIMIT 12;

但这样 随机的范围局限于前几个 所以在加了 php 随机数 rand(0,25)

/**
 * WeiCot Framework
 * User: ajiang
 * WebSite: WWW.WEICOT.COM
 * Date: 2017/04/27
 * Time: 0:21
 */
$SQL="
SELECT *
FROM `movie_info` AS t1 JOIN (
SELECT ROUND(RAND() * (
(SELECT MAX(id) FROM `movie_info`)-
(SELECT MIN(id) FROM `movie_info`)
)+
(SELECT MIN(id) FROM `movie_info`)
) AS id
from `movie_info` limit 50) AS t2 on t1.id=t2.id
ORDER BY t1.id LIMIT ". rand(0,25).",12;";

参考与引用
mysql随机查询若干条数据
Mysql 添加索引 和创建索引

转载请注明:(●--●) Hello.My Weicot » Mysql 随机查询优化

蜀ICP备15020253号-1