python 一个HTML文件，找出正文和链接

最新推荐文章于 2022-11-22 11:31:57 发布

hbqjzx

最新推荐文章于 2022-11-22 11:31:57 发布

阅读量471

点赞数

分类专栏： Python小技巧

原文链接：https://blog.csdn.net/qq_35614920/article/details/76746902

版权

Python小技巧专栏收录该内容

9 篇文章 0 订阅

订阅专栏

ython 练习册，每天一个小程序

第 0008 题：一个HTML文件，找出里面的正文。

第 0009 题：一个HTML文件，找出里面的链接。

0000-0010题链接

代码如下：

# coding=utf-8
from bs4 import BeautifulSoup
def sechBodyUrl(path):
    with open(path,encoding='utf-8') as fp:
        text = BeautifulSoup(fp, 'lxml')
        urls = text.findAll('a')
        for u in urls:
            print(u['href'])
        content = text.get_text().strip('\n')
    return content

sechBodyUrl('0007.html')
#print(searchBody('0007.html'))

测试结果如下：
这里写图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hbqjzx

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 一个HTML文件，找出正文和链接

ython 练习册，每天一个小程序第 0008 题：一个HTML文件，找出里面的正文。第 0009 题：一个HTML文件，找出里面的链接。0000-0010题链接代码如下：# coding=utf-8from bs4 import BeautifulSoupdef sechBodyUrl(path): with open(path,encoding='utf-8') as fp: text = BeautifulSoup(fp, 'lxml')
复制链接

扫一扫