python soup_Beautiful Soup documentation

If your document starts a declaration and never finishes it,

Beautiful Soup assumes the rest of your document is part of the

declaration. If the document ends in the middle of the declaration,

Beautiful Soup ignores the declaration totally. A couple examples:

如果你的文档开始了声明但却没有关闭,Beautiful Soup假定你的文档的剩余部分都是这个声明的一部分。

如果文档在声明的中间结束了,Beautiful Soup会忽略这个声明。如下面这个例子:

from BeautifulSoup import BeautifulSoup

BeautifulSoup("foo

# foo

soup = BeautifulSoup("foo")

print soup.prettify()

#

# foo

#

There are a couple ways to fix this; one is detailed here.

有几种方法来处理这种情况;其中一种在这里有详细介绍。

Beautiful Soup also ignores an entity reference that's not finished

by the end of the document:

Beautiful Soup 也会忽略实体引用,如果它没有在文档结束的时候关闭:

BeautifulSoup("<foo&gt")

# <foo

I've never seen this in real web pages, but it's probably out there

somewhere.

我从来没有在实际的网页中遇到这种情况,但是也许别的地方会出现。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值