MySQL count()聚合函数详解!
MySQL count()聚合函数详解!
作者:十六点五
MySQL中的COUNT()函数,它是SQL中最常用的聚合函数之一,用于计算表中符合特定条件的行数,本文给大家介绍MySQL count()聚合函数,感兴趣的朋友一起看看吧
深入剖析一下 MySQL 中的 COUNT() 函数。它是 SQL 中最常用的聚合函数之一,用于计算表中符合特定条件的行数。
核心功能
COUNT() 函数的核心功能是计数。它可以用来:
- 统计表中所有行的总数。
- 统计表中特定列的非 NULL 值的数量。
- 结合
WHERE子句,统计满足特定条件的行的数量。 - 结合
GROUP BY子句,统计每个分组中的行数。
语法形式
COUNT() 函数主要有三种语法形式,它们在行为和性能上有所不同:
- COUNT(*)
- 功能: 统计查询结果集中的总行数。
- 计数方式: 它计算所有行,不管该行中的列是否包含 NULL 值。即使整行所有列都是 NULL,
COUNT(*)也会将其计入。 - 性能: 在大多数现代 MySQL 版本(尤其是 InnoDB 存储引擎)中,
COUNT(*)通常经过高度优化。MySQL 知道COUNT(*)只需要行数,而不需要检查任何具体的列值。这是获取表总行数或分组行数的推荐方式。 - 示例:
123456
-- 统计 `users` 表中的总用户数SELECTCOUNT(*)FROMusers;-- 统计每个部门 (`dept_id`) 的员工数量SELECTdept_id,COUNT(*)ASemployee_countFROMemployeesGROUPBYdept_id;
COUNT(expression)- 功能: 统计表达式
expression计算结果为非 NULL 值的行数。 - 计数方式: 对每一行计算给定的表达式 (
expression)。如果表达式的结果是 非 NULL,则计数加 1;如果结果是 NULL,则不计入。 expression可以是:- 一个列名 (
COUNT(column_name)):统计该列中非 NULL 值的数量。这是最常见的使用方式。 - 一个常量 (
COUNT(1),COUNT('abc')):因为常量永远是非 NULL 的,所以COUNT(1)或COUNT('任何常量')的行为几乎总是等同于COUNT(*),统计总行数。现代 MySQL 优化器通常会将COUNT(1)转换为COUNT(*)来执行。 - 一个表达式 (
COUNT(UPPER(name)),COUNT(price * quantity)):先计算表达式,然后判断结果是否为 NULL。
- 一个列名 (
- 性能: 如果
expression是一个列名,MySQL 需要检查该列的值是否为 NULL。如果该列没有索引,对于大表来说,这可能比COUNT(*)稍慢一些(因为COUNT(*)可以利用存储引擎的内部优化)。如果expression是常量,性能通常与COUNT(*)相当。 - 示例:
12345678
-- 统计 `users` 表中设置了邮箱 (`email` 列非 NULL) 的用户数SELECTCOUNT(email)FROMusers;-- 统计 `orders` 表中总金额 (`total_amount`) 大于 100 的订单数量 (假设 total_amount 可为 NULL)SELECTCOUNT(total_amount > 100)FROMorders;-- 注意:`total_amount > 100` 的结果是布尔值 (TRUE, FALSE, 或 NULL)。在 MySQL 中,TRUE=1, FALSE=0, NULL=NULL。所以 COUNT 只会计入结果为 TRUE (1) 的非 NULL 行。-- 更常见的写法是结合 WHERE: SELECT COUNT(*) FROM orders WHERE total_amount > 100;-- 统计 `products` 表中 `name` 字段非 NULL 的产品数量 (等同于 COUNT(name))SELECTCOUNT(*)FROMproductsWHEREnameISNOTNULL;-- 另一种写法
- 功能: 统计表达式
COUNT(DISTINCT expression)- 功能: 统计表达式
expression计算结果中不同(唯一、去重后)的非 NULL 值的数量。 - 计数方式: 首先计算所有行中
expression的值,然后去除结果集中的 NULL 值,最后对剩下的非 NULL 值进行去重,统计去重后的数量。 - 性能: 这是性能开销最大的一种形式,因为它涉及到对所有非 NULL 值进行排序或使用哈希表来去重。对于大表,尤其是在没有合适索引的情况下,可能会比较慢。
- 示例:
123456
-- 统计 `users` 表中来自不同城市 (`city`) 的数量 (忽略 city 为 NULL 的行)SELECTCOUNT(DISTINCTcity)FROMusers;-- 统计 `orders` 表中每个客户 (`customer_id`) 下了多少种不同商品 (`product_id`) 的订单SELECTcustomer_id,COUNT(DISTINCTproduct_id)ASunique_products_orderedFROMordersGROUPBYcustomer_id;
- 功能: 统计表达式
重要特性与行为
COUNT()与 NULL:COUNT(*):不关心 NULL,统计所有行。COUNT(expression):只统计expression计算结果为非 NULL 的行。COUNT(DISTINCT expression):只统计expression计算结果为非 NULL 的值,并且对这些非 NULL 值进行去重计数。
- 聚合函数:
COUNT()是一个聚合函数。它通常作用于一组行(可能是整个表,或者GROUP BY定义的每个组),并返回一个单一的汇总值。 - 与
WHERE结合:WHERE子句在聚合发生之前过滤行。COUNT()只会计入通过WHERE条件过滤后的行。1SELECTCOUNT(*)FROMordersWHEREorder_date >='2024-01-01';-- 统计2024年及之后的订单数 - 与
GROUP BY结合:GROUP BY将数据分成多个组,COUNT()会为每个组单独计算行数或非 NULL 值的数量。1SELECTstatus,COUNT(*)ASorder_countFROMordersGROUPBYstatus;-- 统计每种订单状态的数量 - 与
HAVING结合:HAVING子句在聚合发生之后过滤分组结果。它基于聚合结果(如COUNT(*))来筛选哪些分组应该出现在最终结果中。1234SELECTcountry,COUNT(*)ASuser_countFROMusersGROUPBYcountryHAVINGuser_count > 100;-- 只显示用户数超过100的国家 COUNT()返回类型:COUNT()函数返回一个BIGINT类型的值(64位整数)。即使结果很小,返回类型也是BIGINT。- 没有匹配行: 如果查询没有匹配任何行(例如,
WHERE条件太严格),COUNT()将返回 0。COUNT(DISTINCT ...)在没有非 NULL 值时也返回 0。 - 性能考虑(MyISAM vs InnoDB):
- MyISAM: 对于
COUNT(*)且没有WHERE条件的查询(如SELECT COUNT(*) FROM myisam_table;),MyISAM 引擎会极其快速地返回结果,因为它直接在表的元数据中存储了精确的总行数。 - InnoDB: InnoDB 引擎不存储精确的总行数在元数据中。它需要扫描表(或最小的可用索引)来计算
COUNT(*)(即使没有WHERE子句)。这是因为 MVCC(多版本并发控制)机制使得同时存在的事务可能看到表中不同版本的行数。因此,对于非常大的 InnoDB 表,SELECT COUNT(*) FROM huge_innodb_table;可能会比较慢。估算行数可以考虑查询information_schema.TABLES表的TABLE_ROWS列(注意这是估算值,不精确!),或者使用计数器表、缓存等技术。
- MyISAM: 对于
如何选择使用哪种形式?
- 需要总行数? ➡️ 优先使用
COUNT(*)。它是语义最清晰(计算行数),且在 MySQL 中通常性能最佳。 - 需要统计特定列的非 NULL 值数量? ➡️ 使用
COUNT(column_name)。 - 需要统计满足特定条件的行数? ➡️ 结合
WHERE子句使用COUNT(*)(推荐) 或COUNT(1)。SELECT COUNT(*) FROM table WHERE condition;
- 需要统计某一列中不同值的数量(去重计数)? ➡️ 使用
COUNT(DISTINCT column_name)。 - 需要统计满足某个表达式条件的行数? ➡️ 使用
COUNT(expression),或者更常见的,使用COUNT(*)+WHERE子句。SELECT COUNT(IF(score > 90, 1, NULL)) FROM students;-- 统计分数大于90的学生数- 等价于
SELECT COUNT(*) FROM students WHERE score > 90;(通常更推荐后者)
总结
COUNT() 函数是 MySQL 中用于计数的核心聚合函数。理解 COUNT(*)、COUNT(expression) 和 COUNT(DISTINCT expression) 之间的区别至关重要:
COUNT(*):统计所有行(推荐用于计数总行数或分组行数)。COUNT(expression):统计expression结果非 NULL 的行数(用于统计特定列的非 NULL 值)。COUNT(DISTINCT expression):统计expression结果中不同(唯一)的非 NULL 值的数量(用于去重计数)。
根据你的具体需求(是统计行数、特定列的非 NULL 值数、还是唯一值数)选择正确的形式,并结合 WHERE、GROUP BY、HAVING 子句来精确控制计数范围
到此这篇关于MySQL count()聚合函数详解的文章就介绍到这了。
学习资料见知识星球。
以上就是今天要分享的技巧,你学会了吗?若有什么问题,欢迎在下方留言。
快来试试吧,小琥 my21ke007。获取 1000个免费 Excel模板福利!
更多技巧, www.excelbook.cn
欢迎 加入 零售创新 知识星球,知识星球主要以数据分析、报告分享、数据工具讨论为主;
1、价值上万元的专业的PPT报告模板。
2、专业案例分析和解读笔记。
3、实用的Excel、Word、PPT技巧。
4、VIP讨论群,共享资源。
5、优惠的会员商品。
6、一次付费只需129元,即可下载本站文章涉及的文件和软件。

