BeautifulSoup的简单爬取应用（常用自定义函数收集）

最新推荐文章于 2023-04-15 14:02:49 发布

阿磊AC

最新推荐文章于 2023-04-15 14:02:49 发布

阅读量341

点赞数 2

分类专栏： python-爬虫学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Joe19310/article/details/90146540

版权

python-爬虫学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

from urllib.request import urlopen
from urllib.error import HTTPError
from bs4 import BeautifulSoup

# 常用的函数的收集
def getTitle(url):
    # 测试服务器是否存在  测试服务器上面的文件是否存在
    try:
        html = urlopen(url)

    except HTTPError as e:
        return None
    # 测试标签是否存在
    try:
        bsObj = BeautifulSoup(html.read())
        title = bsObj.body.h1
    except AttributeError as e:
        return None
    return title

title = getTitle("http://www.pythonscraping.com/pages/page1.html")

if title == None:
    print("Title could not be found")
else:
    print(title)

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

阿磊AC CSDN认证博客专家 CSDN认证企业博客

码龄7年

128: 原创

74万+: 周排名

207万+: 总排名

11万+: 访问

: 等级

2410: 积分

26: 粉丝

21: 获赞

4: 评论

57: 收藏

私信

关注

热门文章

分类专栏

C++项目
python-爬虫学习 1篇
STL 4篇
动态规划 22篇
思维题 10篇
数学几何 3篇
数学 17篇
RSA 算法 1篇
水题 33篇
搜索 5篇
模拟 11篇
字符串 8篇
暴力 3篇
回溯 2篇
递归 3篇
枚举 2篇
数据结构 21篇
文件 1篇
牛客网 5篇
贪心 1篇
快速幂 1篇

最新评论

找规律填数字
二本清华他行我更行: 你这过不了的啊，比如q 小于1时候的等比数列，很多情况都没考虑
橱窗的插花问题
下山买菜-: 楼主，当花比花瓶多，每个花瓶可以插多支花，这个问题可不可以解决？
矩阵填充问题
cleargy: 如果是100万乘以100万的矩阵呢？
Is Derek lying?
hansy2015: 5 1 2 ABBBB ABBBB 这组数据错了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。