正则优化

Posted Aug 6, 2024

By 夏显林

3 min read

正则优化

将文字文本独立出来
- 从量词中“提取”必须元素
- “提取”多选结构开头的必须元素
将锚点独立出来
- 在表达式前面独立出**^和\G**
- 在表达式末尾独立出**$**
忽略优先/匹配优先
- 目标字符串很长，冒号比较接近字符串开头，使用忽略优先量词
- 目标字符串很长，分号比较接近字符串末尾，使用匹配优先量词
- 数据随机时，使用匹配优先的量词
拆分正则表达式
模拟开头字符识别
使用固化分组和占有优先量词
主导引擎的匹配
- 将最可能匹配的多选分支放在前头
- 将结尾部分分散到多选结构内
消除循环：「opening normal*(special normal)* closing」
- special 部分和 normal 部分匹配的开头不能重合
- normal 部分必须匹配至少一个字符
- special 部分必须是固化的
- 寻找通用套路

正则

This post is licensed under CC BY 4.0 by the author.

Trending Tags