爬新浪新闻中的新闻文本内容

最新推荐文章于 2024-05-10 12:36:22 发布

jibian6343

最新推荐文章于 2024-05-10 12:36:22 发布

阅读量279

点赞数

本文链接：https://blog.csdn.net/jibian6343/article/details/80052632

版权

import requests
from bs4 import BeautifulSoup as bs
res = requests.get('http://news.sina.com.cn/c/zj/2018-04-20/doc-ifzihneq2559172.shtml')
res.encoding = 'utf-8'
soup = bs(res.text,'lxml')
t =[]
for p in soup.select('.article p'):
    t.append(p.text.strip())
print('\n'.join(t))

就是随便点进新浪新闻的一篇新闻，在python3.5环境下爬出新闻的文本内容。

注意：

1）soup.select()函数中的article前面的'.'表示的是所有class = 'article'，下的内容；若id为article，则要改成soup.select('# article p')；

2）最后的输出形式根据自己的要求来。'\n'是对于每段article换行连接起来以str的形式输出。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jibian6343

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬新浪新闻中的新闻文本内容

import requestsfrom bs4 import BeautifulSoup as bsres = requests.get('http://news.sina.com.cn/c/zj/2018-04-20/doc-ifzihneq2559172.shtml')res.encoding = 'utf-8'soup = bs(res.text,'lxml')t =[]for ...
复制链接

扫一扫