`
java-mans
  • 浏览: 11421553 次
文章分类
社区版块
存档分类
最新评论

正则习点 --- 08

 
阅读更多

2.2.5. Adding Commas to Number with Lookaround

在这一节,我们要引入一个新的概念:环视(lookaround)。

他的定义:不匹配任何字符,只匹配文本中的特定位置positions)。

环视分两种:顺序环视(lookahead)和逆序环视(lookbehind)。

我们在后面的小段会给出详细的介绍。

现在我们只需要知道顺序环视是从左到右查看文本;而逆序环视是从右到左查看文本。

为了理解这个新单词,我们可以想象她像单词分界符「\b」、锚点「^」和「$」一样的工作!但是,比它们更加通用!

2.2.5.1 A few more lookahead examples

一个不用环视的例子:

s/\bJeffs\b/Jeff’s/g

全字匹配“Jeffs”,然后,把它替换“Jeff’s”。

使用顺序环视解决这个问题:

s/\bJeff(?=s\b)/Jeff’/g

如图:

首先,匹配「Jeff」,然后,尝试顺序环视。

只有当「s\b」在此位置能够匹配时(也就是’Jeff’之后紧跟一个’s’和一个单词分界符)整个表达式才能匹配成功。

也就是「Jeff」确定匹配文本,而顺序环视只是“选择”一个位置。

换成逆序环视的例子:

s/(?<=\bJeff)(?=s\b)/’/g

如图,

我们来总结解决这个问题的几种方法:

Solution

Comments

s/\bJeffs\b/Jeff’s/g

解决此类问题最容易想到的办法,未使用环视,正则“占用”整个’Jeffs’

s/\b(Jeff)(s)\b/$1’$2/g

只增加了变量,没有多余的好处

s/\bJeff(?=s\b)/Jeff’/g

并没有占用’s’,除了展示顺序环视之外,没有什么实用价值。

s/(?<=\bJeff)(?=s\b)/’/g

并没有“占用”任何文本,同时使用顺序环视和逆序环视匹配需要的位置,即撇号插入的位置。非常适用于讲解环视。

s/(?=s\b)(?<=\bJeff)/’/g

与上一个表达式完全相同,只是颠倒了两个环视结构。因为它并没有占用任何字符,所以变换顺序并没有影响。

好了,我们在实际中来使用环视。

2.2.5.2 The comma example

大的数值,如果在其间加入逗号,会更容易看懂。

例如,“The US population is 298444215”, 如果使用逗号,“298,444,215”会看起来更加自然。

插入逗号,必须满足“左边有数字,右边数字的个数正好是3的倍数”。

左边有数字,使用逆序环视:「(?<=\d)」

右边数字的个数正好是3的倍数,使用顺序环视:「(?=(\d\d\d)+$)」

整个正则看起来像:

s/(?<=\d)(?=(\d\d\d)+$)/’/g

我们写一段代码,来验证它:

#! /usr/bin/perl -w

# Mastering Regular Expressiona: Chapter 2 Section 2.
# fourth program

$testVal = 12345 * 1987;

$testVal =~ s/(?<=\d)(?=(\d\d\d)+$)/,/g;
print "This Value is $testVal decimal.";


执行结果:

This Value is 24,529,515 decimal.

2.2.5.3 Word boundaries and negative lookaround

我们再增加点难度,如果数字是在整个字符串的中间。怎么办呢?

$testStr = “This Value is 24529515 decimal.”

这个时候,就不能使用行尾锚点(「$」),而应该换上单词分界符(「\b」)

修改后的程序如下:

#! /usr/bin/perl -w

# Mastering Regular Expressiona: Chapter 2 Section 2.
# fourth program

$testVal = 12345 * 1987;

$testStr = "This Value is $testVal decimal.";

$testStr =~ s/(?<=\d)(?=(\d\d\d)+\b)/,/g;

print $testStr;


迄今为止我们用到的顺序环视和逆序环视应该被称作肯定顺序环视(positive lookahead)和肯定逆序环视(positive lookbehind)。因为它们成功的条件都是子表达式在这些位置能够匹配。

那么有没有成功的条件是子表达式无法匹配的环视呢?有!

它们是:否定顺序环视(negative lookahead)和否定逆序环视(negative lookbehind)。见下表:

Four Types of Lookaround

Type

Regex

Successful if the enclosed subexpression

Positive Lookbehind

(?<=……)

Successful if can match to the left

Negative Lookbehind

(?<!……)

Successful if can not match to the left

Positive Lookahead

(?=……)

Successful if can match to the right

Negative Lookahead

(?!……)

Successful if can not match to the right

我们再增加点难度,如果数字旁边有字母,怎么办呢?

$testStr = “This Value is 24529515Hz decimal.”

这个时候使用否定顺序环视会更好!

(?!\d)

更改后的正则如下:

s/(?=\d)(?=(\d\d\d)+(?!\d))/,/g

修改后的程序如下:

#! /usr/bin/perl -w

# Mastering Regular Expressiona: Chapter 2 Section 2.
# fourth program

$testVal = "24529515Hz";	# 12345 * 1987

$testStr = "This Value is $testVal decimal.";

$testStr =~ s/(?<=\d)(?=(\d\d\d)+(?!\d))/,/g;

print $testStr;


分享到:
评论

相关推荐

    linux系统shell正则表达式-练习工具和教材

    linux系统shell正则表达式-练习工具和教材 正则表达式-练习工具和教材 正则表达式-练习工具和教材

    正则表达式 到 NFA

    这是编译原理的一个实验, 是把一个正则表达式转化为不确定有穷自动机NFA的算法程序,朋兴趣的朋友可以下载来看看哦. 一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式...

    各类正则表达式详细手册

    包括ORACLE+PLSQL正则表达式手册、详细的Javascript正则表达式参考手册、C#字符串和正则表达式参考手册

    正则表达式规则及常用正则表达式列举

    正则表达式规则及常用正则表达式列举,应该很全了

    Python-Flask

    basics - Bin-block 全局解释器锁练习源码 - Bin-Coroutine 协程练习源码 + Coroutine 协程练习源码 + greenlet 模块 - Bin-Thread 线程练习源码 - Bin-Multiprocessing 多进程练习 - Bin-Re 正则表达式练习 ...

    正则表达式经典案例学习讲解

    javascript的正则表达式的经典案例详解,从入门到熟练~

    正则表达式专题

    学习完正则表达式后,有必要通过一定的习题来检验自己的学习情况

    正则表达式学习笔记

    正 则 表 达 式 学 习 笔 记

    编译原理正则表达式转NFA转DFA DFA最小化 Cpp代码

    编译原理课的大作业 包含三个小实验 在一个cpp文件里 正则表达式转换为nfa nfa转换为dfa dfa最小化 个人原创代码

    模式分类PatternClassificationSecondEdition中译本-模式分类.part1.rar

    6.11正则化复杂度调节和剪枝 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------- 第七章随机方法 7.1引言 7.2随机搜索 7.3学习 7.4网络和图示模型 7.5进化方法 7.6规则 本章小结 ...

    模式分类PatternClassificationSecondEdition中译本-模式分类.part2.rar

    6.11正则化复杂度调节和剪枝 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------- 第七章随机方法 7.1引言 7.2随机搜索 7.3学习 7.4网络和图示模型 7.5进化方法 7.6规则 本章小结 ...

    编译原理习题答案3-3

    这个资源有问题,已损坏,需要的朋友请下载“编译原理第三部分(重发)”,给大家带来麻烦对不起了~~~ 西北工业大学出版,第三版,蓝色封面,课后习题答案,一共三个部分,可单独解压,

    正则表达式匹配IP的表达式(推荐)

    这里给大家详细讲解一下一个匹配IP地址的正则表达式,  有关正则方面的知识,会在详细的讲解中提到。  在讲解之前,我先给大家介绍一下,ip地址的生成规则。  IP地址,是由32位数字二进制转为四个十进制的字符串...

    正则表达式

    此课程较全面的讲解了正则表达式,之后还有习题供做训练。适合初学者。

    老王Python基础+进阶+项目篇(高清无密)

    进阶篇25-正则表达式1.2 进阶篇26-socket1.1 进阶篇27-高性能的多线程网络资源访问 进阶篇28-高性能的多线程网络资源访问第二节 进阶篇29-http相关讲解 进阶篇30-wsgi讲解 进阶篇31-进阶综合习题应用 进阶篇32-综合...

    实数变函数和范函分析(南开大学下载)

    第 5 讲 不动点原理及应用 第 6 讲 紧集与连续映射 第 7 讲 紧性与有限维空间 第 8 讲 积空间与商空间 习 题 一 第二章 有界线性算子与有界线性泛函 第 9 讲 空间 B(X, Y) 与 X* 第 10 讲 共鸣...

    JAVA开发实战经典

    JAVA开发实战经典课后习题讲解第11章:正则习题讲解

    正则表达式入门学习经典

    包含一些实例,以及课件习题,同样也包含一些可供开发时参考的代码,又陷入深。

    金成值书后习题第四章

    第四章详细答案解析 文法与语法分析,文法的二义性,等价文法,算法,正则nfa,dfa到正则文法的转换,判断文法是LL(1)文法,文法分析表,文法分析过程

    Perl语言入门(第五版-中文版).pdf

    本书的诸位作者自1991年起就开始在stonehenge consulting从事perl教学工作,多年的课堂教学实践和积累下来的点滴经验,形成了本书特有的教学节奏,以及务实的知识点取舍。随文而至的习题,可以让你及时巩固各种概念...

Global site tag (gtag.js) - Google Analytics