正则匹配url提取

0 0

匹配url提取，从昨晚到现在才搞明白，记下来省得忘掉

$reg = “#<a[^>]+href=(['\"])(.+)[\1\s]#isU”;

# 表示开始结束，没什么意义。

<a 匹配链接开始特征

[^>] 不等于>的任何字符

href= 匹配链接特征

['\"] []表示包含其中的任意一个字符，包含“’”或者“””

(.+) .表示任意一个非换行的字符，+匹配前面的子表达式一次或多次

\1 表示逆向引用子模式1，在这个例子也就是引用 ['\"]

\s 表示空格

i 正则修正符，大小写不敏感

s 正则修正符，多行，即忽略换行

U 非贪婪模式

11 years, 12 months ago

Droid 11 years, 12 months ago