正则表达式在每种语言中都会有,目的就是匹配符合你预期要求的字符串。
7.1 Shell正则表达式
基础正则表达式:BRE(basic regular express)
扩展正则表达式:ERE(extend regular express),扩展的表达式有+、?、|和()
符号
描述
示例
. 匹配除换行符(\n)之外的任意单个字符匹配123:
echo -e "123\n456" |grep -E '1.3'
^ 匹配字符串开头匹配以abc开头的行:
echo -e "abc\nxyz" |grep -E ^abc
$ 匹配字符串结尾匹配以xyz结尾的行:
echo -e "abc\nxyz" |grep -E xyz$
* 匹配多个匹配以w开头d结尾的字符串:
echo "hello world" |grep -E -o 'world'
+ 匹配1个或多个匹配abc和abcc:
echo -e "abc\nabcc\nadd" |grep -E 'ab+'
这样是匹配单个数字:echo "113" |grep -E -o '[0-9]' 连续匹配多个数字:echo "113" |grep -E -o '[0-9]+' ? 匹配0个或1个匹配ac或abc:
echo -e "ac\nabc\nadd" |grep -E 'a?c'
[ ] 匹配中括号之中的任意一个字符匹配a或c:
echo -e "a\nb\nc" |grep -E '[ac]' [ .-.] 匹配中括号中范围内的任意一个字符匹配所有字母:
echo -e "a\nb\nc" |grep -E '[a-z]' [^] 匹配[^字符]之外的任意一个字符匹配a或b:
echo -e "a\nb\nc" |grep -E '[^c-z]' {n}或{n,} 匹配花括号前面字符至少n个字符匹配abc字符串(至少三个字符以上字符串):
echo -e "a\nabc\nc" |grep -E '[a-z]{3}' {n,m} 匹配花括号前面字符至少n个字符,最多m个字符匹配12和123(不加边界符会匹配单个字符):
echo -e "1\n12\n123\n1234" |grep -E -o '\<[0-9]{2,3}\>' \< 边界符,匹配字符串开始匹配开始是123和1234:
echo -e "1\n12\n123\n1234" |grep -E '\<123'
\> 边界符,匹配字符串结束匹配结束是1234:
echo -e "1\n12\n123\n1234" |grep -E '4\>'
( )单元或组合:将小括号里面作为一个组合
分组:匹配小括号中正则表达式或字符。\n反向引用,n是数字,从1开始编号,表示引用第n个分组匹配的内容
单元:匹配123a字符串
echo "123abc" |grep -E -o '([0-9a-z]){4}'分组:匹配11
echo "113abc" |grep -E -o '(1)\1'
| 匹配竖杠两边的任意一个匹配12和123:
echo -e "1\n12\n123\n1234" |grep -E '12\>|123\>'
\ 转义符,将特殊符号转成原有意义 1.2,匹配1.2:1\.2,否则112也会匹配到Posix字符
描述
[:alnum:] 等效[a-zA-Z0-9] [:alpha:] 等效[a-zA-Z] [:lower:] 等效[a-z] [:upper:] 等效[A-Z] [:digit:] 等效[0-9] [:space:] 匹配任意空白字符,等效[\t\n\r\f\v] [:graph:] 非空白字符 [:blank:] 空格与定位字符 [:cntrl:] 控制字符 [:print:] 可显示的字符 [:punct:] 标点符号字符 [:xdigit:] 十六进制示例:
echo -e "1\n12\n123\n1234a" |grep '[[:digit:]]' 博客地址:http://lizhenliang.blog.51cto.com QQ群:Shell/python运维开发群 323779636在Shell下使用这些正则表达式处理文本最多的命令有下面几个:
命令
描述
grep 默认不支持扩展表达式,加-E选项开启ERE。使用花括号要加转义符\{\} egrep 支持基础和扩展表达式 awk 使用花括号需要开启posix支持:--posix sed 默认不支持扩展表达式,加-r选项开启ERE。使用花括号要加转义符\{\}或-rsed/grep支持的特殊字符
描述
\w 匹配任意数字和字母,等效[a-zA-Z0-9_] \W 与\w相反,等效[^a-zA-Z0-9_] \b 匹配字符串开始或结束,等效\<和\&