开发者

Java正则表达式之Pattern和Matcher的使用

目录
  • 前言
  • 一、Pattern和Matcher的简单使用
  • 二、Pattern详解
    • 2.1 Pattern 常用方法
      • 2.1.1 compile(String regex)
      • 2.1.2 matches(String regex, CharSequence input)
      • 2.1.3 split(CharSequence input)
      • 2.1.4 pattern()
      • 2.1.5 matcher(CharSequence input)
  • 三、Matcher详解
    • 3.1 Matcher 常用方法
      • 3.1.1 matches()
      • 3.1.2 find()
      • 3.1.3 group()
      • 3.1.4 start()
      • 3.1.5 end()
      • 3.1.6 reset(CharSequence input)
  • 总结

    前言

    之前简单分析了Java正则表达式的基础用法和部分规则:String.matches方法使用

    今天来看一下常用来处理正则表达式的两个类:

    • Pattern  包名:java.util.regex.Pattern;

    Pattern 类用于表示一个正则表达式的编译版本。通过 Pattern.compile() 方法可以将一个正则表达式编译成一个 Pattern 对象。

    Pattern 类提供了一系列静态方法用于编译和匹配正则表达式,例如 compile()、matches()、split() 等。

    通过 Pattern 对象可以获取正则表达式的相关信息,例如正则表达式的字符串表示、标志位等。

    • Matcher  包名:java.util.regex.Matcher;

    Matcher 类用于对输入字符串进行匹配操作。它通过 Pattern.matcher() 方法创建,并用于对指定的输入字符串执行匹配操作。

    Matcher 类提供了一系列方法用于执行匹配操作,例如 matches()、find()、group() 等。

    通过 Matcher 对象可以获取匹配结果的相关信息,例如匹配的子字符串、匹配的位置等。

    一、Pattern和Matcher的简单使用

    简单例子代码:

    package com.example.Pattern;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    public class PatternTest {
    
        public static void main(String[] args) {
            String input = "Hello, my age is 25 and my friend's age is 30.";
    
            // 定义正则表达式
            String regex = "\\d+"; // 匹配一个或多个数字
    
            // 编译正则表达式为 Pattern 对象
            Pattern pattern = Pattern.compile(regex);
    
            // 创建 Matcher 对象,并使用正则表达式匹配输入字符串
            Matcher matcher = pattern.matcher(input);
    
            // 查找匹配的数字
            while (matcher.find()) {
                System.out.println("Found: " + matcher.group());
            }
        }	
    }
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    分析:\\d+是匹配1到n个数字,至于findgroup功能后面详解,看样子find方法匹配到就返回true,同时group方法返回捕获到的内容。带着这个简单的例子进入到两个类的详细分析。

    二、Pattern详解

    2.1 Pattern 常用方法

    2.1.1 compile(String regex)

    compile(String regex):

    compile 方法是 Pattern 类的静态方法,用于将给定的正则表达式字符串编译成一个 Pattern 对象。

    该方法接受一个字符串参数 regex,表示要编译的正则表达式。

    编译成功后,将返回一个 Pattern 对象,可以用于后续的匹配操作。

    示例: 上面已经有了,不重复了。

    2.1.2 matches(String regex, CharSequence input)

    matches(String regex, CharSequence input):

    matches 方法是 Pattern 类的静态方法,用于尝试将给定的正则表达式与整个输入字符串进行匹配。

    该方法接受一个字符串参数 regex,表示要匹配的正则表达式,以及一个 CharSequence 参数 input,表示要匹配的输入字符串。

    如果整个输入字符串与正则表达式匹配成功,则返回 true;否则返回 false。

    示例

    public class PatternTest {
    
        public static void main(String[] args) {
            String input = "Hello, my age is 25 and my friend's age is 30.";
    
            // 定义正则表达式
            String regex = "\\d+"; // 匹配一个或多个数字
        
            System.out.println(Pattern.matches(regex, "2")); 
            
            System.out.println(Pattern.matches(regex, "20")); 
            
            System.out.println(Pattern.matches(regex, " ")); 
            
            System.out.println(Pattern.matches(regex, "1 2 3 4 ")); 
            
            System.out.println(Pattern.matches(regex, "abcd")); 
        }	
    }
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    字符串 “2” 符合正则表达式 “\d+”,它包含一个数字字符。

    字符串 “20” 也符合正则表达式 “\d+”,它包含两个数字字符。

    字符串 " " 不符合正则表达式 “\d+”,它不包含任何数字字符。

    字符串 "1 2 3 4 " 不符合正则表达式 “\d+”,它包含空格和数字字符,不是一个连续的数字字符串。

    字符串 “abcd” 不符合正则表达式 “\d+”,它不包含任何数字字符。

    2.1.3 split(CharSequence input)

    split(CharSequence input):

    split 方法用于根据正则表达式将输入字符串分割成多个子字符串。

    该方法接受一个 CharSequence 参数 input,表示要分割的输入字符串。

    返回一个字符串数组,包含了根据正则表XKdLfdqQ达式分割后的子字符串。

    示例

      public static void main(String[] args) {
        	
        	 System.out.println("-------,测试--------");
        	 String text = "apple,banana,orange,pear";
             Pattern pattern = Pattern.compile(",");
             String[] result = pattern.split(text);
             for (String s : result) {
                 System.out.println(phps);
             }   
            
           	 System.out.println("-------\\d+测试--------");
        	 String text1 = "1234,banana,2234,pear";
             Pattern pattern1 = Pattern.compile("\\d+");
             String[] result1 = pattern1.split(text1);
             for (String s : result1) {
                 System.out.println(s);
             } 
             
           	 System.out.println("-------\\d测试--------");
        	 String text2 = "1234,banana,2234,pear";
             Pattern pattern2 = Pattern.compile("\\d");
             String[] result2 = pattern2.split(text2);
             for (String s : result2) {
                 System.out.println(s);
             }  
        }	
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    字符串 “,” 截取了“,”,所以只剩下数字和字母。

    字符串 “\d+” 截取了连续的数字,所以只剩下“,”和字母。

    字符串 “\d"截取了单个的数字,所有相比于”\d+"有了很多换行符。

    2.1.4 pattern()

    pattern():

    pattern 方法用于返回当前 Pattern 对象所表示的正则表达式的字符串形式。

    该方法不接受任何参数,直接返回当前 Pattern 对象的正则表达式字符串。

    示例

        public static void main(String[] args) javascript{
    
             Pattern pattern = Pattern.compile(",");
             String result = pattern.pattern();
             System.out.println(result);
     
             Pattern pattern1 = Pattern.compile("\\d+");
             String result1 = pattern1.pattern();
             System.out.println(result1);
    
             Pattern pattern2 = Pattern.compile("\\d");
             String result2 = pattern2.pattern();
             System.out.println(result2);
        }	
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    该方法不接受任何参数,直接返回当前 Pattern 对象的正则表达式字符串。

    2.1.5 matcher(CharSequence input)

    matcher(CharSequence input):

    matcher 方法用于创建一个 Matcher 对象,用于对指定的输入字符串进行匹配操作。

    该方法接受一个 CharSequence 参数 i编程客栈nput,表示要匹配的输入字符串。

    返回一个 Matcher 对象,可以用于后续的匹配操作。

    示例

        public static void main(String[] args) {
    
        	Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象
        	Matcher matcher = pattern.matcher("1234,banana,2234,pear"); // 使用 Pattern 对象创建 Matcher 对象
            System.out.println(pattern);
            System.out.println(matcher);
        }	
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    Pattern.compile(“\d+”) 返回的是正则表达式 \d+ 的字符串表示形式。而 pattern.matcher(“1234,banana,2234,pear”) 返回的是 Matcher 对象的字符串表示形式,其中包含了正则表达式模式、匹配的区域和最后的匹配结果。

    三、Matcher详解

    3.1 Matcher 常用方法

    3.1.1 matches()

    matches():

    matches 方法尝试将整个输入字符串与模式进行匹配。

    如果整个输入字符串与模式匹配成功,则返回 true;否则返回 false。

    示例

        public static void main(String[] args) {
    
        	Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象
        	Matcher matcher = pattern.matcher("1234"); // 使用 Pattern 对象创建 Matcher 对象
        	System.out.println(matcher.matches());
        	
        	matcher = pattern.matcher("1234d");
        	System.out.println(matcher.matches());
        	
         	matcher = pattern.matcher("12.34");
        	System.out.println(matcher.matches());
        }	
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    matcher.matches() 会尝试对整个输入字符串进行匹配,如果整个输入字符串匹配成功,则返回 true,否则返回 false。

    当输入字符串为 “1234” 时,由于整个字符串都是数字,匹配成功,因此输出为 true。

    当输入字符串为 “1234d” 时,由于字符串中包含非数字字符 android“d”,匹配失败,因此输出为 false。

    当输入字符串为 “12.34” 时,由于字符串中包含小数点 “.”,匹配失败,因此输出为 false。

    3.1.2 find()

    绝大多数情况下:find()和group()方法是搭配起来使用的。

    find():

    find 方法在输入字符串中查找下一个匹配的子序列。

    如果找到匹配的子序列,则返回 true;否则返回 false。

    3.1.3 group()

    group():

    group 方法返回当前匹配的子序列。

    如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 group 方法获取匹配的内容。

    示例

        public static void main(String[] args) {
        	Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象
        	
        	Matcher matcher = pattern.matcher("1234,banana,2234,pear");
    
        	while (matcher.find()) {
        	    System.out.println("匹配的子序列:" + matcher.group());
        	}
        	
        	matcher = pattern.matcher("1234banana2234pear");
        	
        	while (matcher.find()) {
        	    System.out.println("匹配的子序列:" + matcher.group());
        	}
       	 	
        }
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    非常简单

    find 方法在输入字符串中查找下一个匹配的子序列。

    group 方法返回当前匹配的子序列。

    3.1.4 start()

    start():

    start 方法返回当前匹配的子序列的起始索引。

    如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 start 方法获取匹配子序列的起始索引。

    3.1.5 end()

    end():

    end 方法返回当前匹配的子序列的结束索引。

    如果在调用 matches、find 等方法后找到了匹配的子序列,可以使用 end 方法获取匹配子序列的结束索引。

    示例

        public static void main(String[] args) {
        	Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象
        	
        	Matcher matcher = pattern.matcher("1234,banana,2234,pear,911");
        	
        	while (matcher.find()) {
        	    System.out.println("匹配的子序列:" + matcher.group());
            	System.out.println("起始子序列:" + matcher.start());
            	System.out.println("结束子序列:" + matcher.end());
            	System.out.println();
        	}	 	
        }	
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    第一个匹配的子序列为 “1234”,起始位置是 0,结束位置是 4。

    第二个匹配的子序列为 “2234”,起始位置是 12,结束位置是 16。

    第三个匹配的子序列为 “911”,起始位置是 22,结束位置是 25。

    3.1.6 reset(CharSequence input)

    reset(CharSequence input):

    reset 方法将 Matcher 对象的状态重置,使其可以重新在输入字符串中进行匹配。

    在重复使用 Matcher 对象进行匹配时,可以使用 reset ()方法清除之前的匹配状态。

    示例

     public static void main(String[] args) {
            Pattern pattern = Pattern.compile("\\d+"); // 使用 compile() 方法创建 Pattern 对象
            Matcher matcher = pattern.matcher("1234,banana,2234");
    
            // 第一次匹配
            while (matcher.find()) {
                System.out.println("第一次匹配的子序列:" + matcher.group());
                System.out.println("第一次起始子序列:" + matcher.start());
                System.out.println("第一次结束子序列:" + matcher.end());
                System.out.println();
            }
    
            // 重置 Matcher 对象
            matcher.reset("456,orange,789");
    
            // 第二次匹配
            while (matcher.find()) {
                System.out.println("第二次匹配的子序列:" + matcher.group());
                System.out.println("第二次起始子序列:" + matcher.start());
                System.out.println("第二次结束子序列:" + matcher.end());
                System.out.println();
            }
        	
        }	
    

    result:

    Java正则表达式之Pattern和Matcher的使用

    analysis:

    第一次匹配之后,我们调用了 reset() 方法并提供了一个新的输入字符串,这样 Matcher 对象的匹配状态就被重置了,可以重新从新的输入字符串中查找匹配的子序列,并输出相应的信息。

    总结

    Pattern 类是正则表达式的编译表示形式。它通过 compile() 方法将正则表达式编译为一个 Pattern 对象,然后可以使用这个对象来创建 Matcher 对象。Pattern 类提供了一系列静态方法和实例方法,用于对正则表达式进行编译、匹配和其他操作。

    Matcher 类是用于对输入字符串进行正则表达式匹配操作的对象。它通过 Pattern 对象的 matcher() 方法创建,并提供了一系列方法用于进行匹配、查找、替换等操作。Matcher 对象可以重复使用,也可以通过 reset() 方法重置其匹配状态。

    到此这篇关于Java正则表达式之Pattern和Matcher的使用的文章就介绍到这了,更多相关Java Pattern Matcher内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)! 

    0

    上一篇:

    下一篇:

    精彩评论

    暂无评论...
    验证码 换一张
    取 消

    最新开发

    开发排行榜