(?isx)<div\s?class=\\?"rslt\\?">(?><div[^>]*> (?<Open>)|</div> (?<-Open>)|(?:(?!</?div\b).)*)*(?(Open)(?!))</div>
这个正则很给力了,在使用的过程中class的内容换成自己的
这个是一个提取超链接的
(?is)<a[^>]*?href=\\?['"]?/?(?<url>[^'"\s>]+)[^>]*>(?<text>(?:(?!</?a\b).)*)</a>
提取table
(?is)<table[^>].*?>.*?</table>