贝利信息

Python多行匹配正则技巧_flags参数使用方法【指导】

日期:2025-12-23 00:00 / 作者:舞夢輝影
Python正则默认不匹配换行符,需用re.DOTALL使.跨行匹配,re.MULTILINE使^$匹配每行首尾,二者作用不同不可混用,组合可用re.DOTALL|re.MULTILINE或(?ms)。

Python正则默认不匹配换行符,多行文本处理常失败。关键在正确使用 re.DOTALLre.MULTILINE 这两个 flags,它们作用不同、不能混用。

re.DOTALL:让点号(.)匹配换行符

默认情况下,. 只匹配除换行符外的任意字符。开启 re.DOTALL 后,. 就能跨行匹配,适合提取跨多行的大段内容(比如HTML标签块、注释块)。

re.MULTILINE:让 ^ 和 $ 匹配每行首尾

默认 ^ 只匹配整个字符串开头,$ 只匹配结尾。启用 re.MULTILINE 后,^$ 会同时匹配每行的开头和结尾,适合逐行处理或提取行首特定模式(如日志中的时间戳、配置项)。

组合使用:同时跨行 + 行首行尾定位

复杂场景(如解析带缩进的 YAML 块、嵌套代码段)可能需要两者共存。可用按位或 | 连接:

其他实用技巧与注意事项

避免踩坑,提升可读性和兼容性: