mysql中字符串函数的基本语法与使用方式

MySQL字符串函数无统一语法,需按各函数签名使用;CONCAT()遇NULL返回NULL,SUBSTRING()索引从1开始,REPLACE()大小写敏感且不支持正则;LENGTH()返回字节数,CHAR_LENGTH()返回字符数。

MySQL 字符串函数不是“统一语法”,每个函数都有独立签名,CONCAT() 要传多个字符串,SUBSTRING() 必须指定起始位置,REPLACE() 的三个参数缺一不可——硬套“基本语法”反而容易写错。

CONCAT() 拼接字符串时 NULL 会污染整个结果

它不忽略 NULL,只要任意一个参数是 NULL,返回值就是 NULL。这不是 bug,是设计行为。

  • IFNULL(col, '')COALESCE(col, '') 预处理空值
  • 想拼接带分隔符的多列(如姓名+电话),优先考虑 CONCAT_WS(',', col1, col2),它自动跳过 NULL
  • CONCAT() 参数类型宽松,数字会隐式转字符串,但显式用 CAST(n AS CHAR) 更可控

SUBSTRING()SUBSTR() 是同一个函数,起始位置从 1 开始

别被名字迷惑:SUBSTR()SUBSTRING() 的同义词,两者完全等价。而且 MySQL 的索引从 1 起算,不是 0 —— 这和 Python、JS 完全相反,容易切错。

  • 提取前 3 个字符:SUBSTRING(str, 1, 3),不是 SUBSTRING(str, 0, 3)
  • 从第 5 位到末尾:SUBSTRING(str, 5),第二个长度参数可省略
  • 负数起始位置表示从末尾倒数:SUBSTRING('abcde', -2) 返回 'de'

REPLACE() 是全局替换,且区分

大小写

它不做正则,只做精确子串替换;默认大小写敏感,REPLACE('Abc', 'a', 'X') 不会改变原字符串。

  • 需要大小写无关替换?先用 LOWER() 统一再操作,或改用正则方案(MySQL 8.0+ 支持 REGEXP_REPLACE()
  • 只换第一次出现?MySQL 原生不支持,得靠变量+循环模拟,实际中建议在应用层处理
  • 注意性能:在 WHERE 条件里用 REPLACE(col, 'x', 'y') = 'z' 会导致全表扫描,无法走索引

LENGTH()CHAR_LENGTH() 的字节 vs 字符区别

中文、emoji 等多字节字符下,二者结果可能不同:LENGTH() 返回字节数,CHAR_LENGTH() 返回字符数。

SELECT 
  LENGTH('你好'),      -- 返回 6(utf8mb4 下每个汉字占 3 字节)
  CHAR_LENGTH('你好');  -- 返回 2
  • 判断字符串“长度”是否超限(比如用户名最多 10 个字),必须用 CHAR_LENGTH()
  • 截断存储前校验空间占用?用 LENGTH() 更贴近磁盘实际消耗
  • 字段定义为 VARCHAR(255),指的是最多 255 个字符,不是 255 字节 —— 所以 CHAR_LENGTH() 才匹配语义

字符串函数看着简单,但 NULL 处理、索引失效、字节/字符混淆这三点,是线上 SQL 出问题最频繁的源头。写完记得用真实数据测一遍 NULL 和中文场景。