1.4.10 Parentheses andBackreferences
小括号的用途:
1.限制多选项(alternation)的范围;
2.使用「|」将若干字符组合为一个单元,受问号或星号之类量词的作用;
3.反向引用(backreference);表现形式为元字符序列「\1…」
例如,
% egrep -i '\<([a-z]+) +\1\>' files…
1.4.11 The Great Escape
转义符:在除了字符组内部之外使用反斜线(backslash),使元字符失去特殊含义,成为普通字符。
比如:
「\.」:转义的点号
1.5.1 A Few More Examples
1.5.1.1 A string within double quotes
A simple solution to matching a stringwithin double quotes might be: 「”[^”]*”」
两端的引号用来匹配字符串开头和结尾的引号。在这两个引号之间的文本可以包括双引号之外的任何字符。所以我们使用「[^*]」来匹配除双引号之外的任何字符,用「*」来表示两个引号之间可以存在任意数目的非双引号字符。
1.5.2 Regular Expression Nomenclature
1.5.2.1 Regex
正则表达式,简称正则(Regex)
1.5.2.2 Matching
正则表达式「a」不能匹配cat,但是能匹配cat中的a。
1.5.2.3 Metacharacter
只有在字符组外部并且是在未转义的情况下,才有意义。
1.5.2.4 Flavor
我们主要讲Perl流派。
1.5.2.5 Subexpression
“子表达式”指的是整个正则表达式中的一部分,通常是小括号内的表达式,或者是由「|」分隔的多选(alternation)分支。
1.5.2.6 Character
ASCII编码的字节
1.5.3 Summary
Egrep工具的元字符总结。
Table1-3. Egrep Metacharacter Summary
Items to Match a Single Character
|
Metacharacter
|
Matches
|
.
|
dot
|
Matches any one character
|
[…]
|
character class
|
Matches any one character listed
|
[^…]
|
negated character class
|
Matches any one character not listed
|
\char
|
escaped character
|
When char is a metacharacter, or the escaped combination is not otherwise special, matches the literal char
|
Items Appended to Provide “Counting”: The Quantifiers
|
?
|
question
|
One allowed, but it is optional
|
*
|
star
|
Any number allowed, but all are optional
|
+
|
plus
|
At least one required; additional are optional
|
{min, max}
|
specified range†
|
Min required, max allowed
|
Items That Match a Position
|
^
|
caret
|
Matches the position at the start of the line
|
$
|
dollar
|
Matches the position at the end of the line
|
\<
|
word boundary†
|
Matches the position at the start of a word
|
\>
|
word boundary†
|
Matches the position at the end of a word
|
Other
|
|
|
alternation
|
Matches either expression it separates
|
(…)
|
parentheses
|
Limits scope of alternation, provide grouping for the quantifies, and “captures” for backreferences
|
\1, \2, ...
|
backreference†
|
Matches text previously matched within first, second, etc., set of parentheses.
|
分享到:
相关推荐
linux系统shell正则表达式-练习工具和教材 正则表达式-练习工具和教材 正则表达式-练习工具和教材
这是编译原理的一个实验, 是把一个正则表达式转化为不确定有穷自动机NFA的算法程序,朋兴趣的朋友可以下载来看看哦. 一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式...
包括ORACLE+PLSQL正则表达式手册、详细的Javascript正则表达式参考手册、C#字符串和正则表达式参考手册
正则表达式规则及常用正则表达式列举,应该很全了
basics - Bin-block 全局解释器锁练习源码 - Bin-Coroutine 协程练习源码 + Coroutine 协程练习源码 + greenlet 模块 - Bin-Thread 线程练习源码 - Bin-Multiprocessing 多进程练习 - Bin-Re 正则表达式练习 ...
javascript的正则表达式的经典案例详解,从入门到熟练~
学习完正则表达式后,有必要通过一定的习题来检验自己的学习情况
正 则 表 达 式 学 习 笔 记
编译原理课的大作业 包含三个小实验 在一个cpp文件里 正则表达式转换为nfa nfa转换为dfa dfa最小化 个人原创代码
6.11正则化复杂度调节和剪枝 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------- 第七章随机方法 7.1引言 7.2随机搜索 7.3学习 7.4网络和图示模型 7.5进化方法 7.6规则 本章小结 ...
6.11正则化复杂度调节和剪枝 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------- 第七章随机方法 7.1引言 7.2随机搜索 7.3学习 7.4网络和图示模型 7.5进化方法 7.6规则 本章小结 ...
这个资源有问题,已损坏,需要的朋友请下载“编译原理第三部分(重发)”,给大家带来麻烦对不起了~~~ 西北工业大学出版,第三版,蓝色封面,课后习题答案,一共三个部分,可单独解压,
这里给大家详细讲解一下一个匹配IP地址的正则表达式, 有关正则方面的知识,会在详细的讲解中提到。 在讲解之前,我先给大家介绍一下,ip地址的生成规则。 IP地址,是由32位数字二进制转为四个十进制的字符串...
此课程较全面的讲解了正则表达式,之后还有习题供做训练。适合初学者。
进阶篇25-正则表达式1.2 进阶篇26-socket1.1 进阶篇27-高性能的多线程网络资源访问 进阶篇28-高性能的多线程网络资源访问第二节 进阶篇29-http相关讲解 进阶篇30-wsgi讲解 进阶篇31-进阶综合习题应用 进阶篇32-综合...
第 5 讲 不动点原理及应用 第 6 讲 紧集与连续映射 第 7 讲 紧性与有限维空间 第 8 讲 积空间与商空间 习 题 一 第二章 有界线性算子与有界线性泛函 第 9 讲 空间 B(X, Y) 与 X* 第 10 讲 共鸣...
JAVA开发实战经典课后习题讲解第11章:正则习题讲解
编译原理正则式转NFA转DFA以及最小化
包含一些实例,以及课件习题,同样也包含一些可供开发时参考的代码,又陷入深。
第四章详细答案解析 文法与语法分析,文法的二义性,等价文法,算法,正则nfa,dfa到正则文法的转换,判断文法是LL(1)文法,文法分析表,文法分析过程