SQL 相关子查询

在SQL中，子查询是一个嵌套在其他查询中的查询。相关子查询是一种特殊的子查询，它的执行依赖于外部查询的每一行数据。这意味着相关子查询会为外部查询的每一行执行一次，而不是像普通子查询那样只执行一次。

什么是相关子查询？

相关子查询是指子查询中的条件依赖于外部查询的列。换句话说，子查询的结果会根据外部查询的每一行数据而变化。这种依赖关系使得相关子查询的执行效率较低，但在某些场景下非常有用。

语法结构

相关子查询的工作原理

为了更好地理解相关子查询的工作原理，让我们通过一个简单的例子来说明。

假设我们有两个表：employees 和 departments。

CREATE TABLE employees (
    employee_id INT PRIMARY KEY,
    employee_name VARCHAR(100),
    department_id INT,
    salary DECIMAL(10, 2)
);

CREATE TABLE departments (
    department_id INT PRIMARY KEY,
    department_name VARCHAR(100)
);

我们想要查询每个部门中工资最高的员工。可以使用相关子查询来实现：

SELECT e.employee_name, e.salary, e.department_id
FROM employees e
WHERE e.salary = (
    SELECT MAX(salary)
    FROM employees e2
    WHERE e2.department_id = e.department_id
);

在这个查询中，子查询 SELECT MAX(salary) FROM employees e2 WHERE e2.department_id = e.department_id 会为外部查询中的每一行执行一次，找出每个部门中的最高工资。

实际应用场景

场景1：查找每个部门的最高工资员工

假设我们有一个公司数据库，包含员工和部门信息。我们想要找出每个部门中工资最高的员工。可以使用相关子查询来实现：

SELECT e.employee_name, e.salary, e.department_id
FROM employees e
WHERE e.salary = (
    SELECT MAX(salary)
    FROM employees e2
    WHERE e2.department_id = e.department_id
);

场景2：查找工资高于部门平均工资的员工

另一个常见的场景是查找工资高于其所在部门平均工资的员工：

SELECT e.employee_name, e.salary, e.department_id
FROM employees e
WHERE e.salary > (
    SELECT AVG(salary)
    FROM employees e2
    WHERE e2.department_id = e.department_id
);

在这个查询中，子查询计算每个部门的平均工资，然后外部查询筛选出工资高于该平均值的员工。

总结

相关子查询是SQL中一种强大的工具，允许我们在查询中嵌套依赖于外部查询的子查询。尽管相关子查询在某些场景下非常有用，但在处理大数据集时需要注意性能问题。通过合理使用相关子查询，我们可以解决许多复杂的查询问题。

附加资源与练习

练习1：尝试在现有的数据库中创建一个相关子查询，找出每个部门中工资最低的员工。
练习2：使用相关子查询找出工资高于公司平均工资的员工。

提示

如果你对相关子查询的性能有疑问，可以尝试使用EXPLAIN语句来分析查询的执行计划，找出可能的性能瓶颈。

什么是相关子查询？​

语法结构​

相关子查询的工作原理​

实际应用场景​

场景1：查找每个部门的最高工资员工​

场景2：查找工资高于部门平均工资的员工​

相关子查询的性能考虑​

总结​

附加资源与练习​