请问百度的正则表达式规则有哪些吖
07.21 22:33:43发布
有趣的灵魂
正则表达式格式示例:
1、纯数字替换生成pattern例子:
eg1:url对应关系:
http://www.abc.com/26299483.html->http://m.abc.com/26299483.html
pattern:
http://www.abc.com/([0-9]+).html->http://m.abc.com/${1}.html
eg2:url对应关系:
http://www.abc.com/t26299483.html->http://m.abc.com/26299483.html
http://www.abc.com/t([0-9]+).html->http://m.abc.com/${1}.html
2、纯字母替换生成pattern例子:
eg:url对应关系:
http://www.abc.com/fawliute/->http://m.abc.com/fawliute/
http://www.abc.com/([a-zA-Z]+)/->http://m.abc.com/${1}/
3、字母和数字混合的字符串替换生成pattern的例子:
http://www.abc.com/a1cc1n2q5y3/->http://m.abc.com/a1cc1n2q5y3/
http://www.abc.com/((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+)/->http://m.abc.com/${1}/
注意:字母和数字混合字符串,字母和数字必须交替出现至少1次
有效例子:a13b,23a9,da3bc99,42a1c
http://news.abc.com/09/1001/07/5KH8DE1F000120GR.html
->http://m.abc.com/news/09/1001/07/5KH8DE1F000120GR.html
pattern:
http://news.abc.com/([0-9]+)/([0-9]+)/([0-9]+)/([a-zA-Z0-9]+).html
->http://m.abc.com/news/${1}/${2}/${3}/${4}.html
4、对于字母和数字只交替出现一次的,可以分别用数字和字母进行正则替换:
http://www.abc.com/az123/->http://m.abc.com/az123/
http://www.abc.com/([a-zA-Z]+)([0-9]+)/->http://m.abc.com/${1}${2}/
5、中文字符串正则替换生成pattern例子:
http://www.abc.com/长城花园/->http://m.abc.com/长城花园/
http://www.abc.com/((?:%[a-zA-Z0-9]{2,})+)/->http://m.abc.com/${1}/
6、由'-'或者'_'连接的数字或者字母替换生成pattern的例子:
http://www.abc.com/byd-c3/->http://m.abc.com/byd-c3/
http://www.abc.com/([a-zA-Z]+)-([a-zA-Z]+)([0-9]+)/->http://m.abc.com/${1}-${2}${3}/
注意:'-'和'_'出现多次可以使用同样的方式处理
如:abc-134_x-1
7、对参数部分进行正则替换生成pattern的例子:
http://www.abc.com/article.html?act=test&id=123->http://m.abc.com/article.html?act=test&id=123
http://www.abc.com/article\.html?act=([^&]+)&id=([^&]+)->http://m.abc.com/article.html?act=${1}&id=${2}
8、PC存在分页对应移动页面生成pattern的例子:
http://www.a.com/1234-1.htmhttp://www.a.com/1234-2.htm->http://m.a.com/1234.htm
http://www.a.com/([0-9]+)-([0-9]+).htm->http://m.a.com/${1}.htm
百度的正则表达式规则主要有电脑端表达式和移动端表达式。
电脑端表达式:使用正则符号替换字母成数字(\d+)表示纯数字字符串,(\w+)表示字母数字下划线组成的字符串。
移动端表达式:使用序号符号替换,依次用$(1),$(2)等表示替换适配pc链接中的可替换参数成路径。
最多设置5个标签!
正则表达式格式示例:
1、纯数字替换生成pattern例子:
eg1:url对应关系:
http://www.abc.com/26299483.html->http://m.abc.com/26299483.html
pattern:
http://www.abc.com/([0-9]+).html->http://m.abc.com/${1}.html
eg2:url对应关系:
http://www.abc.com/t26299483.html->http://m.abc.com/26299483.html
pattern:
http://www.abc.com/t([0-9]+).html->http://m.abc.com/${1}.html
2、纯字母替换生成pattern例子:
eg:url对应关系:
http://www.abc.com/fawliute/->http://m.abc.com/fawliute/
pattern:
http://www.abc.com/([a-zA-Z]+)/->http://m.abc.com/${1}/
3、字母和数字混合的字符串替换生成pattern的例子:
eg1:url对应关系:
http://www.abc.com/a1cc1n2q5y3/->http://m.abc.com/a1cc1n2q5y3/
pattern:
http://www.abc.com/((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+)/->http://m.abc.com/${1}/
注意:字母和数字混合字符串,字母和数字必须交替出现至少1次
有效例子:a13b,23a9,da3bc99,42a1c
eg2:url对应关系:
http://news.abc.com/09/1001/07/5KH8DE1F000120GR.html
->http://m.abc.com/news/09/1001/07/5KH8DE1F000120GR.html
pattern:
http://news.abc.com/([0-9]+)/([0-9]+)/([0-9]+)/([a-zA-Z0-9]+).html
->http://m.abc.com/news/${1}/${2}/${3}/${4}.html
4、对于字母和数字只交替出现一次的,可以分别用数字和字母进行正则替换:
eg:url对应关系:
http://www.abc.com/az123/->http://m.abc.com/az123/
pattern:
http://www.abc.com/([a-zA-Z]+)([0-9]+)/->http://m.abc.com/${1}${2}/
5、中文字符串正则替换生成pattern例子:
eg:url对应关系:
http://www.abc.com/长城花园/->http://m.abc.com/长城花园/
pattern:
http://www.abc.com/((?:%[a-zA-Z0-9]{2,})+)/->http://m.abc.com/${1}/
6、由'-'或者'_'连接的数字或者字母替换生成pattern的例子:
eg:url对应关系:
http://www.abc.com/byd-c3/->http://m.abc.com/byd-c3/
pattern:
http://www.abc.com/([a-zA-Z]+)-([a-zA-Z]+)([0-9]+)/->http://m.abc.com/${1}-${2}${3}/
注意:'-'和'_'出现多次可以使用同样的方式处理
如:abc-134_x-1
7、对参数部分进行正则替换生成pattern的例子:
eg:url对应关系:
http://www.abc.com/article.html?act=test&id=123->http://m.abc.com/article.html?act=test&id=123
pattern:
http://www.abc.com/article\.html?act=([^&]+)&id=([^&]+)->http://m.abc.com/article.html?act=${1}&id=${2}
8、PC存在分页对应移动页面生成pattern的例子:
eg:url对应关系:
http://www.a.com/1234-1.htmhttp://www.a.com/1234-2.htm->http://m.a.com/1234.htm
pattern:
http://www.a.com/([0-9]+)-([0-9]+).htm->http://m.a.com/${1}.htm
百度的正则表达式规则主要有电脑端表达式和移动端表达式。
电脑端表达式:使用正则符号替换字母成数字(\d+)表示纯数字字符串,(\w+)表示字母数字下划线组成的字符串。
移动端表达式:使用序号符号替换,依次用$(1),$(2)等表示替换适配pc链接中的可替换参数成路径。
一周热门 更多>