MySQL的10件事—它们也许和你预想的不一样-MySQL-IT技术网

#10. 搜索一个“NULL”值

SELECT * FROM a WHERE a.column = NULL

在SQL中，NULL什么也不等于，而且NULL也不等于NULL。这个查询不会返回任何结果的，实际上，当构建那个plan的时候，优化器会把这样的语句优化掉。

当搜索NULL值的时候，应该使用这样的查询：

SELECT * FROM a WHERE a.column IS NULL

#9. 使用附加条件的LEFT JOIN

SELECT * FROM a LEFT JOIN b ON b.a = a.id WHERE b.column = 'something'

除了从a返回每个记录（至少一次），当没有真正匹配的记录的时候，用NULL值代替缺失的字段之外，LEFT JOIN和INNER JOIN都是一样的。

但是，在LEFT JOIN之后才会检查WHERE条件，所以，上面这个查询在连接之后才会检查column。就像我们刚才了解到的那样，非NULL值才可以满足相等条件，所以，在a的记录中，那些在b中没有对应的条目的记录不可避免地要被过滤掉。

从本质上来说，这个查询是一个INNER JOIN，只是效率要低一些。

为了真正地匹配满足b.column = 'something'条件的记录（这时要返回a中的全部记录，也就是说，不过滤掉那些在b中没有对应的条目的记录），这个条件应该放在ON子句中：

SELECT * FROM a LEFT JOIN b ON b.a = a.id AND b.column = 'something'

#8. 小于一个值，但是不为NULL

我经常看到这样的查询：

SELECT * FROM b WHERE b.column < 'something' AND b.column IS NOT NULL

实际上，这并不是一个错误：这个查询是有效的，是故意这样做的。但是，这里的IS NOT NULL是冗余的。

如果b.column是NULL，那么无法满足b.column < 'something'这个条件，因为任何一个和NULL进行的比较都会被判定为布尔NULL，是不会通过过滤器的。

有趣的是，这个附加的NULL检查不能和“大于”查询（例如：b.column > 'something'）一起使用。

这是因为，在MySQL中，在ORDER BY的时候，NULL会排在前面，因此，一些人错误地认为NULL比任何其他的值都要小。

这个查询可以被简化：

SELECT * FROM b WHERE b.column < 'something'

在b.column中，不可能返回NULL

#7. 按照NULL来进行连接

SELECT * FROM a JOIN b ON a.column = b.column

在两个表中，当column是nullable的时候，这个查询不会返回两个字段都是NULL的记录，原因如上所述：两个NULL并不相等。

这个查询应该这样来写：

SELECT * FROM a JOIN b ON a.column = b.column OR (a.column IS NULL AND b.column IS NULL)

MySQL的优化器会把这个查询当成一个“等值连接”，然后提供一个特殊的连接条件：ref_or_null

#6. NOT IN和NULL值

SELECT a.* FROM a WHERE a.column NOT IN ( SELECT column FROM b )

如果在b.column中有一个NULL值，那么这个查询是不会返回任何结果的。和其他谓词一样，IN 和 NOT IN 遇到NULL也会被判定为NULL。

你应该使用NOT EXISTS重写这个查询：

SELECT a.* FROM a WHERE NOT EXISTS ( SELECT NULL FROM b WHERE b.column = a.column )

不像IN，EXISTS总是被判定为true或false的。

#5. 对随机的样本进行排序

SELECT * FROM a ORDER BY RAND(), column LIMIT 10

这个查询试图选出10个随机的记录，按照column来排序。

ORDER BY会按照自然顺序来对输出结果进行排序：这就是说，当第一个表达式的值相等的时候，这些记录才会按照第二个表达式来排序。

但是，RAND()的结果是随机的。要让RAND()的值相等是行不通的，所以，按照RAND()排序以后，再按照column来排序也是没有意义的。

要对随机的样本记录进行排序，可以使用这个查询：

SELECT * FROM ( SELECT * FROM mytable ORDER BY RAND() LIMIT 10 ) q ORDER BY column

#4. 通过一个组来选取任意的记录

这个查询打算通过某个组（定义为grouper来）来选出一些记录

SELECT DISTINCT(grouper), a.* FROM a

DISTINCT不是一个函数，它是SELECT子句的一部分。它会应用到SELECT列表中的所有列，实际上，这里的括号是可以省略的。所以，这个查询可能会选出grouper中的值都相同的记录（如果在其他列中，至少有一个列的值是不同的）。

有时，这个查询可以正常地使用( 这主要依赖于MySQL对GROUP BY的扩展）：

SELECT a.* FROM a GROUP BY grouper

在某个组中返回的非聚合的列可以被任意地使用。

首先，这似乎是一个很好的解决方案，但是，它存在着一个很严重的缺陷。它依赖于这样一个假设：虽然可以通过组来任意地获取，但是返回的所有值都要属于一条记录。

虽然当前的实现似乎就是这样的，但是它并没有文档化，无论何时，它都有可能被改变（尤其是，当MySQL学会了在GROUP BY的后面使用index_union的时候）。所以依赖于这个行为并不安全。

如果MySQL支持分析函数的话，这个查询可以很容易地用另一种更清晰的方式来重写。但是，如果这张表拥有一个PRIMARY KEY的话，即使不使用分析函数，也可以做到这一点：

SELECT a.* FROM ( SELECT DISTINCT grouper FROM a ) ao JOIN a ON a.id = ( SELECT id FROM a ai WHERE ai.grouper = ao.grouper LIMIT 1 )

#3. 通过一个组来选取第一条记录

把前面那个查询稍微变化一下：

SELECT a.* FROM a GROUP BY grouper ORDER BY MIN(id) DESC

和前面那个查询不同，这个查询试图选出id值最小的记录。

同样：无法保证通过a.*返回的非聚合的值都属于id值最小的那条记录（或者任意一条记录）

这样做会更清晰一些：

SELECT a.* FROM ( SELECT DISTINCT grouper FROM a ) ao JOIN a ON a.id = ( SELECT id FROM a ai WHERE ai.grouper = ao.grouper ORDER BY ai.grouper, ai.id LIMIT 1 )

这个查询和前面那个查询类似，但是使用额外的ORDER BY可以确保按id来排序的第一条记录会被返回。

#2. IN和‘,’——值的分隔列表

这个查询试图让column的值匹配用‘,’分隔的字符串中的任意一个值：

SELECT * FROM a WHERE column IN ('1, 2, 3')

这不会正常发挥作用的，因为在IN列表中，那个字符串并不会被展开。

如果列column是一个VARCHAR，那么它（作为一个字符串）会和整个列表（也作为一个字符串）进行比较，当然，这不可能匹配。如果 column是某个数值类型，那么这个列表会被强制转换为那种数值类型（在最好的情况下，只有第一项会匹配）

处理这个查询的正确方法应该是使用合适的IN列表来重写它：

SELECT * FROM a WHERE column IN (1, 2, 3)

或者，也可以使用内联：

SELECT * FROM ( SELECT 1 AS id UNION ALL SELECT 2 AS id UNION ALL SELECT 3 AS id ) q JOIN a ON a.column = q.id

但是，有时这是不可能的。

如果不想改变那个查询的参数，可以使用FIND_IN_SET：

SELECT * FROM a WHERE FIND_IN_SET(column, '1,2,3')

但是，这个函数不可以利用索引从表中检索行，会在a上执行全表扫描。

#1. LEFT JOIN和COUNT(*)

SELECT a.id, COUNT(*) FROM a LEFT JOIN b ON b.a = a.id GROUP BY a.id

这个查询试图统计出对于a中的每条记录来说，在b中匹配的记录的数目。

问题是,在这样一个查询中，COUNT(*)永远不会返回一个0。对于a中某条记录来说，如果没有匹配的记录，那么那条记录还是会被返回和计数。

只有需要统计b中的记录数目的时候才应该使用COUNT。既然可以使用COUNT(*)，那么我们也可以使用一个参数来调用它（忽略掉NULL），我们可以把b.a传递给它。在这个例子中，作为一个连接主键，它不可以为空，但是如果不想匹配，它也可以为空。

原文标题：10 things in MySQL (that won’t work as expected)

MySQL的10件事—它们也许和你预想的不一样

电脑屏幕不小心竖起来了？别慌，快捷键搞定

Destoon 模板存放规则及语法参考

Destoon系统常量与变量

Destoon系统目录文件结构说明

Destoon 系统安装指南

Destoon会员公司主页模板风格添加方法

Destoon 二次开发入门

Microsoft 将于 2026 年 10 月终止对 Windows 11 SE 的支持

Windows 11 存储感知如何设置?了解Windows 11 存储感知开启的好处

Windows 11 24H2 更新灾难：系统升级了，SSD固态盘不见了...

Synology 更新 ActiveProtect Manager 1.1 以增强企业网络弹性和合规性

新的 Rubrik Agent Cloud 加速了可信的企业 AI 代理部署

宇树科技 G1人形机器人，拉动一辆重达1.4吨的汽车

Cloudera 调查发现，96% 的企业已将 AI 集成到核心业务流程中，这表明 AI 已从竞争优势转变为强制性实践

投资者反对马斯克 1 万亿美元薪酬方案，要求重组特斯拉董事会

技术热点

大型网站的 HTTPS 实践（三）：基于协议和配置的优化

ubuntu下右键菜单添加新建word、excel文档等快捷方式

Sublime Text 简明教程

用户定义SQL Server函数的描述

怎么在windows 7开始菜单中添加下载选项？

SQL Server 2016将有哪些功能改进？

MySQL的10件事—它们也许和你预想的不一样

别人在看