other text
我试图从html页面的一个主标记中提取所有内容(标记和文本)。例如:`my_html_page = '''
some text inside p
- one li
- second li
some text 2
text inside div
some text 3
text inside second main div
third div
four div
'''`
我需要使用xpath("(//div[@class="post_body"])[1]"):
^{pr2}$
所有内部标记
我需要用lxml中的beauthulsoup解析器创建DOM。在import lxml.html.soupparser
import lxml.html
text_inside_tag =