$html = '<source src="http://live.aikan.miguvideo.com/envivo_w/2018/SD/imezone=UTC"></source>';

正则表达式

/<source\s+[^>]*?src="(.*?)"[^>]*>/i
  • 1.
<source\s+:匹配<source标签开头,后面跟着一个或多个空白字符。
[^>]*?:非贪婪地匹配任何不是>的字符,直到遇到src属性。
src="(.*?)":匹配src=",然后捕获双引号内的任何字符(非贪婪地),直到遇到下一个双引号。这里的(.*?)是一个捕获组,用于存储匹配到的src属性的值。
[^>]*>:非贪婪地匹配任何不是>的字符,直到遇到标签的结束>。
/i:修饰符,表示不区分大小写。
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

php使用

$html = '<source src="http://live.aikan.miguvideo.com/envivo_w/2018/SD/imezone=UTC"></source>';  
  
if (preg_match('/<source\s+[^>]*?src="(.*?)"[^>]*>/i', $html, $matches)) {  
    echo $matches[1];  
}
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

python实现

import re

html = '<source src="http://live.aikan.miguvideo.com/envivo_w/2018/SD/imezone=UTC"></source>';  

matches = re.match('<source\s+[^>]*?src="(.*?)"[^>]*>', html);  
print(matches.group(1));
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.