python爬取凤凰新闻_python爬虫凤凰网新闻

最新推荐文章于 2024-04-13 23:17:43 发布

weixin_39799290

最新推荐文章于 2024-04-13 23:17:43 发布

阅读量786

点赞数

文章标签： python爬取凤凰新闻

首先使用chrome浏览器，找到网页要爬取内容的代码，鼠标选中，右键，选择菜单项“检查”

3f3ed251d4b4?utm_campaign

之后，就会在页面下方该选中位置的源代码，

3f3ed251d4b4?utm_campaign

这时，就可以查看class, p, title等标签。写python代码进行爬取了。

爬取凤凰新闻页面的新闻标题，简介，时间和链接。

代码如下：

import requests

from bs4 import BeautifulSoup

web_data =requests.get('http://news.ifeng.com/listpage/101231/1/list.shtml')

soup = BeautifulSoup(web_data.text,'lxml')

a = 1

for data in soup.select('.box_list'):

detail =data.select('.box_txt p')[0].text

time =data.select('span')[0].text

title =data.select('h2 a')[0]['title']

link =data.select('h2 a ')[0]['href']

print('%d.'%a,title,link,detail,time)

a = a+1

print("新闻条数:",a-1)

爬取截图如下：

3f3ed251d4b4?utm_campaign

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注