gcgmh 发表于 2013-2-7 20:38:21

java 正则表达式

\\ 反斜杠
\t 间隔 ('\u0009')
\n 换行 ('\u000A')
\r 回车 ('\u000D')
\d 数字 等价于
\D 非数字 等价于[^0-9]
\s 空白符号 [\t\n\x0B\f\r]
\S 非空白符号 [^\t\n\x0B\f\r]
\w 单独字符
\W 非单独字符 [^a-zA-Z_0-9]
\f 换页符
\e Escape
\b 一个单词的边界
\B 一个非单词的边界
\G 前一个匹配的结束

^为限制开头
^java   条件限制为以Java为开头字符
$为限制结尾
java$   条件限制为以java为结尾字符
.条件限制除\n以外任意一个单独字符
java..   条件限制为java后除换行外任意两个字符

两者取一「|」
J|A   J或A
Java|Hello   Java或Hello

限制为连续出现指定次数字符「{a}」
J{2}   JJ
J{3}   JJJ

◆文字替换(首次出现字符)
Pattern pattern = Pattern.compile("正则表达式");
Matcher matcher = pattern.matcher("正则表达式 Hello World,正则表达式 Hello World");
//替换第一个符合正则的数据
System.out.println(matcher.replaceFirst("Java"));

◆去除html标记
Pattern pattern = Pattern.compile("<.+?>", Pattern.DOTALL);
Matcher matcher = pattern.matcher("<a href=\"index.html\">主页</a>");
String string = matcher.replaceAll("");
System.out.println(string);
页: [1]
查看完整版本: java 正则表达式