我只想去掉上面所有的标签/代码并返回“text”。在
简而言之:
Text这可能包含JS、CSS等。。在
我试图使用beauthulsoup,但它没有从代码中删除JS。。现在,我正在考虑使用Regex。。但不知道怎么做
编辑1
这是我在一个简单的引导html页面上的尝试。。。在
^{pr2}$
$return文本html
Home
Le styles
body {
padding-top: 10%;
padding-left: 30%;
}
HTML5 shim, for IE6-8 support of HTML5 elements
[if lt IE 9]>
Home | Under Construction
Sample Page 1
The app
might
face some ........
Firefox
. Ple..
/container
var _gaq = _gaq || [];
_gaq.push(['_trackPageview']);
(function() {
var ga = do...............
})();