新手入门学习正则表达式的常见错误

kano个人技术博客 php教程 618 次浏览 没有评论

正则的好处就是易于上手,通过几个小时的学习,大部分的正则就都可以看的懂了,虽然看得懂,但在实践的过程中还是会遇到很多得不到自己想要结果的情况,毕竟正则的语法还是有些奇怪,本文kano个人博客就整理了一些关于正则学习过程中经常会犯的错误。

正则表达式

一、空格

我们在平时写代码的时候,空格通常是用来是使代码更加规范的工具,连同适当的缩进,行首的tab一起,使代码看起来更为清晰。但是在正则中可要小心了——空格本身也属于一个要匹配的字符,不恰当的使用空格的话:

echo preg_match('/a{1, 3}/', "aaa") ? '匹配' : '不匹配';  // 不匹配

如上面这个正则,本意是匹配1~3a,但实际上并不会匹配到后面的3a,因为{1, 3}中间多了一个空格,使得元字符“{}”的本意失效而变成了普通字符:

echo preg_match('/a{1, 3}/', "a{1, 3}") ? '匹配' : '不匹配';  // 匹配

a{1, 3}”这个字符串反而匹配上了,这显然不是我们想要的,所以一定要注意,除非匹配的是空格字符本身,否则空格不要用:

echo preg_match('/a{1,3}/', "aaa") ? '匹配' : '不匹配';  // 匹配

※ 例外的,模式修饰符x可以将正则字符串的空白字符忽略掉——然而只能忽略掉数据字符,像上例中的元字符中的空格还是会出现错误,通常来说这会让正则变的更加难以理解,kano个人技术博客并不太推荐使用:

echo preg_match('/a a a/x', "aaa") ? '匹配' : '不匹配';  // 匹配

二、大小写

这个很好理解,基本就是一个粗心大意的错误,毕竟我们平时用的搜索工具里搜索字母通常大小写都会被匹配,有时候就会忘记正则中并不会自动的匹配大小写:

echo preg_match('/flag/', "Flag") ? '匹配' : '不匹配';  // 不匹配

像这样匹配的字符串中可能有首字母大写的情况,自然就匹配不到了,这时候我们就要把大小写的情况都要考虑进来。不过有时候我们想要匹配某个单词,只要是这4个字母连在一起都要匹配,写起来就比较麻烦:

echo preg_match('/[Ff][Ll][Aa][Gg]/', "Flag") ? '匹配' : '不匹配';  // 匹配

虽然很难想象会有fLaG”这种奇葩的写法,但是不这样写毕竟无法匹配所有情况,但是有时候我们并不关心大小写,要匹配的字符串却很长,都这样写怕是要累死了,不过还好我们有“i”修饰符:

echo preg_match('/flag/i', "Flag") ? '匹配' : '不匹配';  // 匹配

修饰符i”设置后,模式中的大小写匹配将会不敏感。

三、贪婪模式

量词“+”和“*”默认都是贪婪模式的,初学者在未遇到它所带来的问题之前可能并不明白这是什么意思,下面kano来举一个例子:

preg_match_all('/<span>.*<\/span>/', "<span>aaa</span><span>bbb</span>", $matches);
var_dump($matches);

正则表达式

正则的本意是找出字符串中所有的span标签,并把他们放到的一个数组中,然而结果很奇怪:两个span竟然一次都被匹配上了!实际上想一想的话这也是合理的,字符串“<span>aaa</span><span>bbb</span>”确实是以<span>开头并以</span>结尾的,只不过其中的.*匹配了太多的内容“aaa</span><span>bbb”都被匹配上了。这就是“+”和“*”的贪婪模式——默认他们会匹配尽量多的字符,而在后面加一个“?”可以取消这种贪婪模式,让他们只匹配尽量少的内容:

preg_match_all('/<span>.*?<\/span>/', "<span>aaa</span><span>bbb</span>", $matches);
var_dump($matches);

正则表达式

这次我们得到了想要的结果。

正则的语法比较特殊,若是不注意的话还是比较容易采坑的,本个人博客博文给大家介绍了常见的几个坑,希望有所帮助。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

Go