Java里的Pattern类是做什么的_Java正则表达式使用说明

Pattern类用于编译正则表达式为可复用的模式对象,不直接匹配;匹配由Matcher实例执行;支持标志位、线程安全、静态快捷方法及转义处理。

Pattern 类是 Java 中用于编译和表示正则表达式的工具类,它本身不执行匹配操作,而是把字符串形式的正则表达式编译成可高效复用的内部模式对象。真正做匹配的是由它生成的 Matcher 实例。

Pattern 用来编译正则表达式

Java 不允许直接用字符串写正则去匹配,必须先用 Pattern.compile() 把正则字符串转成 Pattern 对象。这个过程会检查语法、优化结构,后续可重复使用该对象,避免反复编译开销。

  • 推荐方式:Pattern pattern = Pattern.compile("\\d{3}-\\d{4}");
  • 带标志(如忽略大小写):Pattern.compile("abc", Pattern.CASE_INSENSITIVE)
  • 如果正则固定且频繁使用,建议定义为 static final Pattern,提升性能

Pattern 提供便捷的静态匹配方法

虽然核心职责是编译,但 Pattern 也封装了几个常用快捷方法,省去手动创建 Matcher 的步骤:

  • pattern.matcher(str).find() → 等价于 pattern.matcher(str).find(),但更底层
  • pattern.matcher(str).matches() → 全串匹配(等价于正则前后加 ^ 和 $)
  • Pattern.matches(regex, str) → 静态方法,适合一次性简单判断,例如 Pattern.matches("\\d+", "123")

Pattern 支持编译选项和预编译复用

正则编译支持多种标志,比如多行模式、注释模式、Unicode 感知等,可在 compile() 时传入;更重要的是,Pattern 对象是线程安全的,可以被多个线程共享,适合在工具类或配置中预先定义好常用规则。

  • 常见标志:Pattern.DOTALL(. 匹配换行符)、Pattern.MULTILINE(^$ 匹配每行起止)
  • 组合多个标志用按位或:Pattern.compile("foo", Pattern.CASE_INSENSITIVE | Pattern.UNICODE_CASE)
  • 避免每次调用都 compile(),尤其在循环或高并发场景下

注意转义和字符串字面量的双重处理

Java 字符串本身会解析反斜杠,而正则又需要反斜杠作转义,所以写匹配反斜杠或特殊字符时要写两个反斜杠:"\\." 表示正则中的 \.(匹配点号),"\\\\\\" 才能匹配一个真正的反斜杠字符。

  • 配数字:"\\d+"
  • 匹配 Windows 路径分隔符:"\\\\\\" 或用 Pattern.quote("\\") 自动转义
  • 不确定怎么转义时,优先用 Pattern.quote(str) 包裹字面量字符串