python爬取凤凰新闻_python爬虫凤凰网新闻

首先使用chrome浏览器,找到网页要爬取内容的代码,鼠标选中,右键,选择菜单项“检查”

3f3ed251d4b4?utm_campaign

之后,就会在页面下方该选中位置的源代码,

3f3ed251d4b4?utm_campaign

这时,就可以查看class, p, title等标签。写python代码进行爬取了。

爬取凤凰新闻页面的新闻标题,简介,时间和链接。

代码如下:

import requests

from bs4 import BeautifulSoup

web_data =requests.get('http://news.ifeng.com/listpage/101231/1/list.shtml')

soup = BeautifulSoup(web_data.text,'lxml')

a = 1

for data in soup.select('.box_list'):

detail =data.select('.box_txt p')[0].text

time =data.select('span')[0].text

title =data.select('h2 a')[0]['title']

link =data.select('h2 a ')[0]['href']

print('%d.'%a,title,link,detail,time)

a = a+1

print("新闻条数:",a-1)

爬取截图如下:

3f3ed251d4b4?utm_campaign

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值