脚本专栏 发布日期:2025/1/11 浏览次数:1
接触编程的朋友都听过正则表达式,在python中叫re模块,属于文字处理服务里面的一个模块。re里面有一个方法叫match,接下来的文章我来详细讲解一下match。
作为新手,我建议多使用帮助文档,也就是help(re),来获取对re的说明。也可以尝试打开模块对应的py文件,细致地了解实现方法。 当然那是后话,饭得一口一口吃。
本文的主角是match,match的作用主要是从字符串起始位置匹配一个模式,如果成功则返回一个对象,失败则为None。
而match的语法是这样:match(pattern,string,flags=0),这三个参数是什么意思呢?pattern代表的是正则表达式,也就是规则,string代表查找的字符串,flags用来表示功能标志位。前面我们已经用了pattern和string这两个参数,大家应该有一个大概的理解了。那么现在来讲讲flags。flags在正则表达式里作为标志修饰符,为可选参数。常用的有re.I表示匹配的时候忽略大小写,还有re.M、re.S和re.X等将在后续文章讲解。
大家现在一定很困惑,返回的这个Match Object是什么鬼?
match方法匹配成功得到的是一个Match对象,我们做正则的意义肯定是用来操作字符串,而不是获取一个Match对象。所以现在讲讲怎么获取这个对象的属性和方法。
对象的字符串我们可以用string来获取,也可以用group获取。如果group里面没有参数或只有一个,两者使用差不多,超过一个,group将以元组的形式返回。
除此之外,还有关于描述索引的属性值得了解,平时也会使用到。
我们使用span来获取匹配分组的起始位置和结束位置,值得说明的是,如果span()里面并未传递参数,默认第一个分组,传递了参数则返回对应分组的起始位置和结束位置。这个参数必须是整数,代表第几个分组。分组也就是前面group方法获取到的。另外如果只想知道起始位置或结束位置,可以用pos和endpos属性来分别获取。
关于match在python3.9.1的使用就介绍到这里了,还有其他的一些属性和方法,感兴趣的朋友可以在我的其他文章找到。