\b是正则表达式规定的一个特殊代码(好吧,某些人叫它元字符,metacharacter),代表着单词的开头或结尾,也就 是单词的分界处。虽然通常英文的单词是由空格,标点符号或者换行来分隔的,但是\b并 不匹配这些单词分隔字符中的任何一个,它只匹配一个位置。如(\bhi\b,him,history,high)。 ####.是另一个元字符,匹配除了换行符以 外的任意字符。 ####*同样是元字符,不过它代表的不是字符,也不是位置,而是数量——它 指定前边的内容可以连续重复使用任意次以使整个表达式得到匹配。 ####换行符就是’\n’,ASCII编码为10(十六进制0x0A)的字符。 ####\d是个新的元字符,匹配一位数字 (0,或1,或2,或……)。0\d{2}-\d{8}。 这里\d后面的{2}({8})的意思是前面\d必须连续重复匹配2次(8次)。 常用的元字符 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字...…
read more...