正则表达式规则、贪婪、非贪婪模式

原文地址:

1、什么是正则表达式的贪婪与非贪婪匹配

  如:String str="abcaxc";

    Patter p="ab*c";

  贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab*c)。

  非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab*c)。

2、编程中如何区分两种模式

  默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。

  下面的都是量词:

                    {m,n}:m到n个

     *:任意多个

     +:一个到多个

     ?:0或一个

demo代码:

[java]  
  1. import java.util.regex.Matcher;  
  2.  import java。util。regex。Pattern;  
  3.    
  4.  public class RegularTest {  
  5.        
  6.      public static void main(String[] arg){  
  7.          String text="(content:\"rcpt to root\";pcre:\"word\";)";  
  8.          String rule1="content:\"。+\"";    //贪婪模式  
  9.          String rule2="content:\"。+?\"";    //非贪婪模式  
  10.            
  11.          System.out.println("文本:"+text);  
  12.          System.out.println("贪婪模式:"+rule1);  
  13.          Pattern p1 =Pattern.compile(rule1);  
  14.          Matcher m1 = p1。matcher(text);  
  15.          while(m1。find()){  
  16.              System.out.println("匹配结果:"+m1。group(0));  
  17.          }  
  18.            
  19.          System.out.println("非贪婪模式:"+rule2);  
  20.          Pattern p2 =Pattern.compile(rule2);  
  21.          Matcher m2 = p2.matcher(text);  
  22.          while(m2。find()){  
  23.              System.out.println("匹配结果:"+m2.group(0));  
  24.          }  
  25.      }  
  26.  }  

贪婪匹配:在满足匹配时,匹配尽可能长的字符串,默认情况下,采用贪婪匹配

[java]  
  1. string pattern1 = @"a。*c";   // greedy match Regex regex = new Regex(pattern1);  
  2. regex.Match("abcabc"); // return "abcabc"  

非贪婪匹配:在满足匹配时,匹配尽可能短的字符串,使用?来表示非贪婪匹配

[java]  
  1. string pattern1 = @"a.*?c";   // non-greedy match Regex regex = new Regex(pattern1);  
  2. regex.Match("abcabc"); // return "abc"  

几个常用的非贪婪匹配Pattern

[java]  
  1. *? 重复任意次,但尽可能少重复  
  2. +? 重复1次或更多次,但尽可能少重复  
  3. ?? 重复0次或1次,但尽可能少重复  
  4. {n,m}? 重复n到m次,但尽可能少重复  
  5. {n,}? 重复n次以上,但尽可能少重复  

3、正则表达式规则

       正则表达式的详细规则描述如下所示:


注意:上述规则应该是标准的Unix正则规则,可能因为软件的不同可能会有所差别。比如之前在使用UltraEdit的正则搜索功能时,发现UltraEdit有自己的正则规则,和标准的Unix规则不太一样,比如在Unix中“.”(点)表示匹配除\n以外的任意字符,但是在UltraEdit中“?”(问号)才表示匹配\n以外的任意字符。如果要了解UltraEdit详细的正则规则描述,可以从UltraEdit的主菜单中找到使用帮助菜单项,打开UltraEdit的帮助文档,在帮助文档中有详细的说明。

版权声明:本文为博主原创文章,遵循版权协议,转载请附上原文出处链接和本声明。
本文链接:
澳洲幸运8 欢乐生肖 秒速时时彩 澳洲幸运8 三分快3 智慧彩票投注 幸运飞艇官网 福建快3开奖 吉林快3开奖 秒速时时彩