python中beautifulsoup怎么输出文本内容,python-使用BeautifulSoup获取标签内的所有内容...

但是,使用时

print soup.article

它只会一直延伸到“ …艺术与Weise和fürverschiedene Zwecke bearbeiten”.

完整代码:

from bs4 import BeautifulSoup

import requests

request_page = requests.get('http://magazine.magix.com/de/5-tipps-fuer-die-fotobearbeitung/', 'html.parser')

source = request_page.text

soup = BeautifulSoup(source, "html.parser")

print soup.article.text

我怎样才能得到一切?

解决方法:

好的,终于找到了.欢迎来到刮刮的神奇世界.

在< article>中,标签,一些< / br>标签存在,那家伙肯定是< br />.

无论如何,它破坏了html流,因此BS很难解析它.

这是我解决的方法:

from bs4 import BeautifulSoup

import requests

request_page = requests.get('http://magazine.magix.com/de/5-tipps-fuer-die-fotobearbeitung/', 'html.parser')

source = request_page.text

source = source.replace('', '
')

soup = BeautifulSoup(source, "html.parser")

print soup.article

(我将< / br>替换为< br /> …)

这是一个很棒的刮板课程,这种东西很多,可以依靠:)

标签:beautifulsoup,web-scraping,python

来源: https://codeday.me/bug/20191025/1931855.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值