关闭 x
IT技术网
    技 采 号
    ITJS.cn - 技术改变世界
    • 实用工具
    • 菜鸟教程
    IT采购网 中国存储网 科技号 CIO智库

    IT技术网

    IT采购网
    • 首页
    • 行业资讯
    • 系统运维
      • 操作系统
        • Windows
        • Linux
        • Mac OS
      • 数据库
        • MySQL
        • Oracle
        • SQL Server
      • 网站建设
    • 人工智能
    • 半导体芯片
    • 笔记本电脑
    • 智能手机
    • 智能汽车
    • 编程语言
    IT技术网 - ITJS.CN
    首页 » SQL Server »SQL Server调优系列基础篇(联合运算符总结)

    SQL Server调优系列基础篇(联合运算符总结)

    2014-12-14 00:00:00 出处:指尖流淌
    分享

    前言

    上两篇文章我们介绍了查看查询计划的方式,以及一些常用的连接运算符的优化技巧,该文我们总结联合运算符的使用方式和优化技巧。

    废话少说,直接进入该文的主题。

    技术准备

    基于SQL Server2008R2版本,利用微软的一个更简洁的案例库(Northwind)进行解析。

    一、联合运算符

    所谓的联合运算符,其实应用最多的就两种:UNION ALL和UNION。

    这两个运算符用法很简单,前者是将两个数据集结果合并,后者则是合并后进行去重操作,如果有过写T-SQL语句的码农都不会陌生。

    我们来分析下这两个运算符在执行计划中的显示,举个例子

    SELECT FirstName+N''+LastName,City,Country FROM Employees
    UNION ALL
    SELECT ContactName,City,Country FROM Customers

    就是上面这个图标了,这就是UNION ALL联合运算符的图标。

    这个联合运算符很简单的操作,将两个数据集合扫描完通过联合将结果汇总。

    我们来看一下UNION 这个运算符,例子如下

    select City,Country from Employees
    UNION
    SELECT City,Country FROM Customers

    我们可以看到,UNION 运算符是在串联运算符之后发生了一个Distinct Sort排序操作,经过这个操作会将结果集合中的重复值去掉。

    我们一直强调:大数据表的排序是一个非常耗资源的动作!

    所以,到这里我们已经找到了可优化的选项,去掉排序,或者更改排序方式。

    替换掉Distinct Sort排序操作的方式就是哈序聚合。Distinct Sort排序操作需要的内存和去除重复之前数据集合的数据量成正比,而哈希聚合需要的内存则是和去除重复之后的结果集成正比!

    所以如果数据行中重复值很多,那么相比而言通过哈希聚合所消耗的内存会少。

    我们来举个例子

    select ShipCountry from Orders
    UNION
    SELECT ShipCountry FROM Orders

    这个例子其实没啥用处,这里就是为了演示,我们来看一下结果

    我们知道,这张表里这个ShipCountry是存在大面积重复值的,所以采用了哈希匹配来去重操作是最优的方式。

    其实,相比哈希匹配连接还有一种更轻量级的去重的连接方式:合并连接

    上一篇我已经分析了这个连接方法,用于两个数据集的连接方式,这里其实类似,应用前都必须先将原结果集合排序!

    我们知道优化的方式可以采用建立索引来提高排序速度。

    我们来重现这种去重方式,我们新建一个表,然后建立索引,代码如下

    --新建表
    SELECT EmployeeID,FirstName+N' '+LastName AS ContactName,City,Country
    INTO NewEmployees
    FROM Employees
    GO
    --添加索引
    ALTER TABLE NewEmployees ADD CONSTRAINT PK_NewEmployees PRIMARY KEY(EmployeeID)
    CREATE INDEX ContactName ON NewEmployees(ContactName)
    CREATE INDEX ContactName ON CUSTOMERS(ContactName)
    GO
    --新建查询,这里一定要加上一个显示的Order by才能出现合并连接去重
    SELECT ContactName FROM NewEmployees
    UNION ALL
    SELECT ContactName FROM Customers
    ORDER BY ContactName

    我们采用索引扫描的方式可以避免显式的排序操作。

    我们将UNION ALL改成UNION,该操作将会对两个数据集进行去重操作。

    --新建查询,这里一定要加上一个显示的Order by才能出现合并连接去重
    SELECT ContactName FROM NewEmployees
    UNION 
    SELECT ContactName FROM Customers
    ORDER BY ContactName

    这里我们知道UNION操作会对结果进行去重操作,上面应用了流聚合操作,流聚合一般应用于分组操作中,当然这里用它进行了分组去重。

    在我们实际的应用环境中,最常用的方式还是合并连接,但是有一种情况最适合哈希连接,那就是一个小表和大表进行联合操作,尤其适合哪种大表中存在大量重复值的情况下。

    哈希算法真是个好东西!

    参考文献

    微软联机丛书逻辑运算符和物理运算符引用 参照书籍《SQL.Server.2005.技术内幕》系列

    结语

    此篇文章先到此吧,简短一点,便于理解掌握,该文主要介绍了查询计划中的联合操作运算符,下一篇我们分析SQL Server中的并行运算,在多核超线程云集的今天,来看SQL Server怎样利用并行运算来最大化的利用现有硬件资源提升性能,有兴趣可提前关注,关于SQL Server性能调优的内容涉及面很广,后续文章中依次展开分析。

    SQL Server这个软件一旦深入进去,你会发现它真的非常深,基本可以用深不见底来描述,如果想研究里面的性能调优这块,可以关注本系列内容,我们一起研究!

    而且到现在还有很多人对SQL Server这套产品有误解,或者说观点有待纠正,以前就遇到过客户直接当我面大谈神马SQL Server导入数据一多就宕机了….

    神马SQL Server只能做小数据量的应用…神马不如Oracle云云….!!!

    还有一部分童鞋单纯的认为SQL Server是小儿科,没啥技术含量…简单的很….

    关于这些观点,我不想吐槽啥,我只想让那些真正了解SQL Server的朋友一起来为SQL Server证明点什么。

    上一篇返回首页 下一篇

    声明: 此文观点不代表本站立场;转载务必保留本文链接;版权疑问请联系我们。

    别人在看

    hiberfil.sys文件可以删除吗?了解该文件并手把手教你删除C盘的hiberfil.sys文件

    Window 10和 Windows 11哪个好?答案是:看你自己的需求

    盗版软件成公司里的“隐形炸弹”?老板们的“法务噩梦” 有救了!

    帝国CMS7.5编辑器上传图片取消宽高的三种方法

    帝国cms如何自动生成缩略图的实现方法

    Windows 12即将到来,将彻底改变人机交互

    帝国CMS 7.5忘记登陆账号密码怎么办?可以phpmyadmin中重置管理员密码

    帝国CMS 7.5 后台编辑器换行,修改回车键br换行为p标签

    Windows 11 版本与 Windows 10比较,新功能一览

    Windows 11激活产品密钥收集及专业版激活方法

    IT头条

    智能手机市场风云:iPhone领跑销量榜,华为缺席引争议

    15:43

    大数据算法和“老师傅”经验叠加 智慧化收储粮食尽显“科技范”

    15:17

    严重缩水!NVIDIA将推中国特供RTX 5090 DD:只剩24GB显存

    00:17

    无线路由大厂 TP-Link突然大裁员:补偿N+3

    02:39

    Meta 千万美金招募AI高级人才

    00:22

    技术热点

    微软已修复windows 7/windows 8.1媒体中心严重漏洞 用户可下载安

    卸载MySQL数据库,用rpm如何实现

    windows 7中使用网上银行或支付宝支付时总是打不开支付页面

    一致性哈希算法原理设计

    MySQL数字类型中的三种常用种类

    如何解决SQL Server中传入select语句in范围参数

      友情链接:
    • IT采购网
    • 科技号
    • 中国存储网
    • 存储网
    • 半导体联盟
    • 医疗软件网
    • 软件中国
    • ITbrand
    • 采购中国
    • CIO智库
    • 考研题库
    • 法务网
    • AI工具网
    • 电子芯片网
    • 安全库
    • 隐私保护
    • 版权申明
    • 联系我们
    IT技术网 版权所有 © 2020-2025,京ICP备14047533号-20,Power by OK设计网

    在上方输入关键词后,回车键 开始搜索。Esc键 取消该搜索窗口。