天天日报丨Python正则表达re模块之findall()函数详解
一、re.findall函数介绍
它在re.py中有定义:
def findall(pattern, string, flags=0): """Return a list of all non-overlapping matches in the string. If one or more capturing groups are present in the pattern, return a list of groups; this will be a list of tuples if the pattern has more than one group. Empty matches are included in the result.""" return _compile(pattern, flags).findall(string)
返回string中所有与pattern匹配的全部字符串,返回形式为数组。
(资料图片仅供参考)
findall()函数的两种表示形式
import re kk = re.compile(r"\d+") kk.findall("one1two2three3four4") #[1,2,3,4] #注意此处findall()的用法,可传两个参数; kk = re.compile(r"\d+") re.findall(kk,"one123") #[1,2,3]
二、实例代码
后面会讲解代码里的各个部分,先列出来~
import re str = "aabbabaabbaa" # 一个"."就是匹配除 \n (换行符)以外的任意一个字符 print(re.findall(r"a.b",str))#["aab", "aab"] # *前面的字符出现0次或以上 print(re.findall(r"a*b",str))#["aab", "b", "ab", "aab", "b"] # 贪婪,匹配从.*前面为开始到后面为结束的所有内容 print(re.findall(r"a.*b",str))#["aabbabaabb"] # 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取 print(re.findall(r"a.*?b",str))#["aab", "ab", "aab"] # 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容 print(re.findall(r"a(.*?)b",str))#["a", "", "a"] str = """aabbab aabbaa bb""" #后面多加了2个b # 没有把最后一个换行的aab算进来 print(re.findall(r"a.*?b",str))#["aab", "ab", "aab"] # re.S不会对\n进行中断 print(re.findall(r"a.*?b",str,re.S))#["aab", "ab", "aab", "aa\n b"]
三、re.findall中正则表达式(.*?)
字符串是
str = "aabbabaabbaa"
1. 符号 . 就 是匹配除 \n (换行符)以外的任意一个字符
print(re.findall(r"a.b",str)) #["aab", "aab"]
2.符号 * 前面的字符出现0次或以上
print(re.findall(r"a*b",str)) #["aab", "b", "ab", "aab", "b"]
3.符号.* 贪婪,匹配从.*前面为开始到后面为结束的所有内容
print(re.findall(r"a.*b",str)) #["aabbabaabb"]
4.符号.*? 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取
print(re.findall(r"a.*?b",str)) #["aab", "ab", "aab"]
5.符号(.*?) 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容
print(re.findall(r"a(.*?)b",str)) #["a", "", "a"]
关于带括号与不带括号的区别
import re string="abcdefg acbdgef abcdgfe cadbgfe" #不带括号 regex=re.compile("((\w+)\s+\w+)") print(regex.findall(string)) #输出:[("abcdefg acbdgef", "abcdefg"), ("abcdgfe cadbgfe", "abcdgfe")] regex1=re.compile("(\w+)\s+\w+") print(regex1.findall(string)) #输出:["abcdefg", "abcdgfe"] regex2=re.compile("\w+\s+\w+") print(regex2.findall(string)) #输出:["abcdefg acbdgef", "abcdgfe cadbgfe"]第一个 regex 中带有2个括号,其输出list 中包含2个 tuple第二个 regex 中带有1个括号,其输出内容是括号匹配到的内容,而不是整个表达式所匹配到的结果。第三个 regex 中不带括号,其输出的内容就是整个表达式所匹配到的内容。
实际上这并不是python特有的,这是正则所特有的 , 任何一门高级语言使用正则都满足这个特点:有括号时只能匹配到括号中的内容,没有括号【相当于在最外层增加了一个括号】。在正则里面 "()" 代表的是分组的意思,一个括号代表一个分组,你只能匹配到 "()" 中的内容。
四、re.findall中参数re.S的意义
1.字符串变为(后面多加了2个b)
str = """aabbab aabbaa bb"""
2.参数无re.S,没有把最后一个换行的aab算进来
print(re.findall(r"a.*?b",str)) #["aab", "ab", "aab"]
3.参数有re.S,不会对\n进行中断
print(re.findall(r"a.*?b",str,re.S)) #["aab", "ab", "aab", "aa\n b"]
参考
Python re.findall中正则表达式(.*?)和参数re.S使用2.python re模块findall()详解
3.Python 正则re模块之findall()详解
总结
到此这篇关于Python正则表达re模块之findall()函数详解的文章就介绍到这了,更多相关Python正则表达re模块findall()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 1转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 2充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 3好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 4名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 5亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战
- 6京东绿色建材线上平台上线 新增用户70%来自下沉市场
- 7网红淘品牌“七格格”chuu在北京又开一家店 潮人新宠chuu能红多久
- 8市场竞争加剧,有车企因经营不善出现破产、退网、退市
- 9北京市市场监管局为企业纾困减负保护经济韧性
- 10市场监管总局发布限制商品过度包装标准和第1号修改单