正则匹配url提取


匹配url提取,从昨晚到现在才搞明白,记下来省得忘掉

$reg = “#<a[^>]+href=(['\"])(.+)[\1\s]#isU”;

# 表示开始结束,没什么意义。

<a 匹配链接开始特征

[^>] 不等于>的任何字符

  • 匹配前面的子表达式一次或多次

href= 匹配链接特征

['\"] []表示包含其中的任意一个字符,包含“’”或者“””

(.+) .表示任意一个非换行的字符,+匹配前面的子表达式一次或多次

\1 表示逆向引用子模式1,在这个例子也就是引用 ['\"]

\s 表示空格

i 正则修正符,大小写不敏感

s 正则修正符,多行,即忽略换行

U 非贪婪模式

正则表达式 php

Droid 11 years, 12 months ago

Your Answer