Python爬虫beautifulsoup

最新推荐文章于 2024-02-23 11:39:34 发布

红尘滚滚念奴娇

最新推荐文章于 2024-02-23 11:39:34 发布

阅读量2.4k

点赞数 3

分类专栏： python 文章标签： Python 爬虫 beautifulsoup &amp;lt;br&amp;gt;

本文链接：https://blog.csdn.net/weixin_40835949/article/details/85797855

版权

1 篇文章 12 订阅

订阅专栏

在Python中用beautifulsoup爬去网页的时候遇到 或者 隔开的文本内容，趴下来的结果是只能获取到 或者 最后一个文本内容，其他的则获取不到。

为了解决这个问题，只需要一步替换。

for example：

aaa

bbb

ccc

</div>

之前：contenttag = pagesoup.select('#abc')

content = contenttag.get_text()

print（content）

content:内容是 ccc

替换后：

contenttag = pagesoup.select('#abc)

content = contenttag.get_text(''\n",' ')

print(content)

这时候 content是：

aaa

bbb

ccc

这是换行后的提取效果，或者用空格代替也可以，contenttag>get_text('',' ')

这时候的content是：aaa bbb ccc

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注