python爬虫利用正则提取指定网页信息

最新推荐文章于 2024-05-21 13:52:56 发布

࿄ ༺ ༼ི钻木取༽ོ༻

最新推荐文章于 2024-05-21 13:52:56 发布

阅读量3.8k

点赞数 2

文章标签： python 正则爬虫数据清洗网络

本文链接：https://blog.csdn.net/weixin_42540398/article/details/90481076

版权

今天练习了一下正则表达式，从结构比较复杂的html代码中，提取出想要的信息

html = '''
    <div id="songs-list">
    <h2 class="title">流行金曲</h2>
    <p class = "introduction">经典歌曲列表</p>
    <ul id="list" class="list-group">
        <li data-view="2">一路上有你</li>
        <li data-view="7">
            <a href="/2.mp3" singer="任贤齐">沧海一声笑</a>
        </li>
        <li data-view="4" class="active">
            <a href="/3.mp3" singer="齐秦">往事随风</a>
        </li>
        <li data-view="6"><a href="/4.mp3" singer="beyond">光辉岁月</a></li>
        <li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
        <li

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

࿄ ༺ ༼ི钻木取༽ོ༻

关注关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python爬虫利用正则提取指定网页信息

今天练习了一下正则表达式，从结构比较复杂的html代码中，提取出想要的信息html = ''' <div id="songs-list"> <h2 class="title">流行金曲</h2> <p class = "introduction">经典歌曲列表</p> <ul id="list" c...
复制链接

扫一扫