JavaScript正则表达式怎样进行模式匹配【教程】

正则表达式本身不执行匹配,需通过test()、match()、replace()等方法调用;test()返回布尔值适合校验,注意g标志下lastIndex影响;match()返回匹配数组或null,g标志下丢失捕获组;replace()第二参数为字符串时会解析$符号,应使用函数避免误替换。

JavaScript 正则表达式本身不“进行匹配”,RegExp 对象或字符串方法(如 test()match()replace())才是执行匹配动作的主体。直接调用正则字面量(如 /abc/)不会触发匹配,必须配合方法使用。

怎样用 test() 判断是否匹配

test() 最适合做布尔校验,比如表单验证、条件分支判断。它返回 truefalse,性能开销最小。

  • 对全局正则(带 g 标志),test() 会修改正则对象的 lastIndex 属性,连续调用可能跳过匹配 —— 多次校验同一字符串时,建议每次新建正则或手动重置 lastIndex = 0
  • 字符串为 nullu

    ndefined
    时,test() 会隐式转成字符串 "null""undefined",不是报错,但结果常不符合预期;建议提前判空
  • 示例:
    const emailRegex = /^[^\s@]+@[^\s@]+\.[^\s@]+$/;
    emailRegex.test("user@example.com"); // true
    emailRegex.test("user@"); // false

怎样用 match() 提取匹配内容

match() 返回 null 或一个数组,数组首项是完整匹配,后续是捕获组(如果有)。它比 exec() 更常用,但行为受标志影响明显。

  • 不带 g 标志时,只返回第一个匹配及其捕获组,indexinput 属性可用
  • g 标志时,只返回纯匹配字符串数组,丢失所有捕获组和位置信息 —— 想同时获取多组捕获内容,必须用 exec() 循环调用
  • 在严格模式下,对 null 调用 match() 会报 TypeError;建议用可选链:str?.match(regex)
  • 示例:
    "a1b2c3".match(/\d/g); // ["1", "2", "3"]
    "a1b2c3".match(/(\d)(\w)/); // ["1b", "1", "b", index: 1, input: "a1b2c3"]

为什么 replace() 的第二个参数不能直接写字符串变量

因为 replace() 字符串替换值中支持特殊符号(如 $1$&),这些会被自动解析为捕获内容或全匹配。如果想插入变量值,又不想被误解析,必须用函数作为第二个参数。

  • 错误写法:str.replace(/(\w+)/, "$1_" + suffix) —— 若 suffix$2$` 等,会被当作内置替换符处理
  • 正确做法:用函数返回真正要插入的字符串
    str.replace(/(\w+)/, (match, p1) => `${p1}_${suffix}`);
  • 全局替换时,函数参数顺序固定:(match, p1, p2, ..., offset, string);第 5 个参数是匹配起始位置,第 6 个是原字符串,常被忽略但关键时刻有用

正则的难点不在语法本身,而在不同方法对标志的响应差异、对输入类型的隐式转换、以及跨调用状态(如 lastIndex)的干扰。写完正则后,务必用边界值(空字符串、null、含转义字符的输入)验证行为是否符合预期。