引言
在SQL查詢中,GROUP BY和DISTINCT都是常用的關(guān)鍵字,它們都能實(shí)現(xiàn)數(shù)據(jù)去重的功能。但它們的實(shí)現(xiàn)原理和使用場(chǎng)景有很大的區(qū)別。
基本概念
DISTINCT
DISTINCT用于刪除結(jié)果集中的重復(fù)行,確保每個(gè)結(jié)果只出現(xiàn)一次。它作用于整個(gè)選擇的列組合。
GROUP BY
GROUP BY用于將具有相同值的行組合到匯總行中,通常與聚合函數(shù)(如COUNT、SUM、AVG等)一起使用。
實(shí)際案例分析
讓我們通過一個(gè)具體的案例來理解它們的區(qū)別。假設(shè)我們有一個(gè)訂單表(orders):
CREATE TABLE orders (
order_id INT,
customer_id INT,
product_id INT,
amount DECIMAL(10,2),
order_date DATE
);
INSERT INTO orders VALUES
(1, 101, 1, 100.00, '2024-02-14'),
(2, 101, 2, 200.00, '2024-02-14'),
(3, 102, 1, 150.00, '2024-02-14'),
(4, 101, 1, 300.00, '2024-02-15');
使用DISTINCT的場(chǎng)景
如果我們想查看有哪些客戶下過訂單:
SELECT DISTINCT customer_id
FROM orders;
-- 結(jié)果
customer_id
-----------
101
102
這個(gè)查詢會(huì)直接返回去重后的客戶ID列表。
使用GROUP BY的場(chǎng)景
如果我們想知道每個(gè)客戶的訂單總金額:
SELECT customer_id,
COUNT(*) as order_count,
SUM(amount) as total_amount
FROM orders
GROUP BY customer_id;
-- 結(jié)果
customer_id order_count total_amount
----------- ----------- ------------
101 3 600.00
102 1 150.00
GROUP BY不僅去除了重復(fù),還能進(jìn)行數(shù)據(jù)匯總計(jì)算。
主要區(qū)別
- GROUP BY:分組匯總,可以配合聚合函數(shù)使用
- DISTINCT:直接返回去重后的數(shù)據(jù)
- GROUP BY:返回分組匯總后的數(shù)據(jù)
- DISTINCT:對(duì)整個(gè)結(jié)果集進(jìn)行去重,通常需要排序操作
- GROUP BY:在分組的同時(shí)進(jìn)行計(jì)算,可能涉及臨時(shí)表的創(chuàng)建
- DISTINCT:不能與聚合函數(shù)直接配合使用(除特殊情況外)
- GROUP BY:可以配合多種聚合函數(shù),支持復(fù)雜的分組計(jì)算
總結(jié)
DISTINCT和GROUP BY雖然都能實(shí)現(xiàn)去重,但它們的使用場(chǎng)景和功能特點(diǎn)有明顯區(qū)別。
DISTINCT適合簡單的去重場(chǎng)景,而GROUP BY更適合需要分組統(tǒng)計(jì)的場(chǎng)景。
- 業(yè)務(wù)需求是否需要分組統(tǒng)計(jì)
合理使用索引和優(yōu)化查詢語句,可以顯著提升查詢性能。
閱讀原文:原文鏈接
該文章在 2025/2/17 12:25:44 編輯過