前段时间在自学Python Spider,在了解了基本的操作与流程之后,开始接触大名鼎鼎的BeautifulSoup。但是在按照例子运行时,发现对于BeautifulSoup还不是很了解,因此参照官方文档与大神的博客,先自学一下。关于BS大部分内容,在网上都可以方便的找到资料,因此这里只记录部分与我有关的内容。
打开HTML文件,创建 soup对象:soup = BeautifulSoup(html)
1.打印soup对象内容,格式化输出:
print soup.prettify()
前段时间在自学Python Spider,在了解了基本的操作与流程之后,开始接触大名鼎鼎的BeautifulSoup。但是在按照例子运行时,发现对于BeautifulSoup还不是很了解,因此参照官方文档与大神的博客,先自学一下。关于BS大部分内容,在网上都可以方便的找到资料,因此这里只记录部分与我有关的内容。
打开HTML文件,创建 soup对象:soup = BeautifulSoup(html)
1.打印soup对象内容,格式化输出:
print soup.prettify()