bs获取新闻标题及链接

最新推荐文章于 2024-05-15 17:10:19 发布

y15518325965

最新推荐文章于 2024-05-15 17:10:19 发布

阅读量913

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/y15518325965/article/details/79406342

版权

#coding:utf-8
#__author__='wang'

import requests
import bs4
from bs4 import BeautifulSoup

url = 'http://news.baidu.com/'
html = requests.get(url).content


#利用bs4对网页源代码进行解析，将其解析成为一个文档树对象
bs_soup = BeautifulSoup(html,'lxml')
#从解析的Document对象中，通过select选择器定位到指定的元素，从而获取新闻列表
#ul.focuslistnews：查找ul标签，并且ul标签的class属性值包含focuslistnews值，
不是focuslistnews值的不查找
#ul .focuslistnews：查找ul标签内部class属性值包含focuslistnews的标签
new_title_list = bs_soup.select('ul.focuslistnews li a')
#先获取a标签对象，然后从对象中取出href值以及文本节点的值
for a in new_title_list:
    #提取标题和链接
    href = a.get('href')
    title = a.get_text().encode('utf-8')
    print '新闻标题：{1}新闻链接：{0}'.format(href,title)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
bs获取新闻标题及链接

#coding:utf-8#__author__='wang'import requestsimport bs4from bs4 import BeautifulSoupurl = 'http://news.baidu.com/'html = requests.get(url).content#利用bs4对网页源代码进行解析，将其解析成为一个文档树对象bs_soup = B...
复制链接

扫一扫

y15518325965 CSDN认证博客专家 CSDN认证企业博客

码龄6年

135: 原创

19万+: 周排名

169万+: 总排名

8万+: 访问

: 等级

2198: 积分

9: 粉丝

9: 获赞

3: 评论

41: 收藏

私信

关注

热门文章

最新评论

selenium操作滚动条
weixin_45115418: 火狐浏览器运行报错： [code=python] from selenium import webdriver import time browser = webdriver.Firefox() browser.get('https://www.baidu.com/') browser.find_element_by_id('kw').send_keys('haha') browser.find_element_by_id('su').click() time.sleep(2) js = "documentElement.scrollTop=1000" browser.execute_script(js) [/code] 结果：[code=python] selenium.common.exceptions.JavascriptException: Message: ReferenceError: documentElement is not defined [/code] 老哥帮忙看下
requests登录知乎新版
qq_34234922: 你好，现在的知乎登录post内容好像变了，变成一串加密的东西了，请问该怎么办？可以的话邮箱我谢谢~~595612931@qq.com
requests登录知乎新版
weixin_41944800: {"show_captcha":false} {"error":{"message":"Missing argument grant_type","code":400}} Process finished with exit code 0 有出现这种错误的没？data中已经带了‘grant_type’了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。