脚本专栏 发布日期:2025/1/21 浏览次数:1
正则表达式
正则表达用来匹配字符串
正则表达式匹配过程
正则表达式语法规则
语法
说明
表达式实例
匹配字符串
abe
ace
ade
ab
abc
abccc
+ 匹配一个字符串1次或无限次 abc+abc
abccc
"4">abc
def
(...) 作为分组,每遇到一个(,分组编号加1,使用分组的好处是匹配的子串会保存到一个子组,便于以后使用 (abc){2} abcabc ("4">贪婪模式是尽可能多的匹配字符串,python默认为贪婪模式,非贪婪模式尽可能少的匹配字符串,在正则表达式后面加个"color: #ff0000">python的re模块
re模块的方法:
1.compile(pattern[,flag]):对正则表达式pattern进行编译,编译后比直接查找速度快
2.match(patter,string[,flag]):从字符串string的开始就匹配,若匹配成功,则返回匹配对象,否则返回None(None对象没有group()和groups()方法,不判断直接调用这两个方法,则会出现异常)
3.search(pattern,string[,flag]):从字符串中查找,若匹配成功,则返回匹配对象,否则返回None
4.findall(pattern,string[,flag]):在字符串 string 中查找正则表达式模式 pattern 的所有(非重复)出现;返回一个匹配对象的列表
5.finditer(pattern,string[, flags])b 和 findall()相同,但返回的不是列表而是迭代器;对于每个匹配,该迭代器返回一个匹配对象
6.split(pattern,string, max=0) 根据正则表达式 pattern 中的分隔符把字符 string 分割为一个列表,返回成功匹配的列表,最多分割 max 次(默认是分割所有匹配的地方)
7.sub(pattern, repl, string, max=0) 把字符串 string 中所有匹配正则表达式 pattern 的地方替换成字符串 repl,如果 max 的值没有给出, 则对所有匹配的地方进行替换
匹配对象的方法和属性:
参数flag:
re.I 使匹配对大小写不敏感 re.L 做本地化识别(locale-aware)匹配 re.M 多行匹配,影响 ^ 和 $ re.S 使 . 匹配包括换行在内的所有字符 re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B. re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
python使用正则表达式的例子
> import re > pattern = re.compile(r'foo') > res1 = re.search(pattern,'foo') > res1.group() # 返回的是匹配对象,需要调用group()方法,显示所有的匹配对象 'foo' > res1.groups()# 因为没有子组(即正则表达式中没有分组),返回空元组 () > res2 = re.findall(pattern,'foobbfoo') > res2 # 直接返回的是一个列表,包含所有匹配的字符 ['foo', 'foo'] > pattern2 = re.compile(r'(\d+)aa') > res3 = re.search(pattern2,'bb32aa') > res3.group() # 返回所有的匹配的对象 '32aa' > res3.groups() # 对比res1的groups(),正则里有分组,返回匹配到的分组 ('32',) > res4 = re.findall(pattern2,'bb32aacc5aacc') > res4 # 对比res2,返回一个列表,但只包含所匹配分组里面的字符, ['32', '5']
总结
以上所述是小编给大家介绍的python正则表达式及使用正则表达式的例子,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!