Python——爬虫（解析简单标签）

最新推荐文章于 2022-07-31 21:20:45 发布

小黄鸭and小黑鸭

最新推荐文章于 2022-07-31 21:20:45 发布

阅读量7.1k

点赞数 3

分类专栏： Python3学习笔记文章标签： python 爬虫 beautifulSoup 标签解析

本文链接：https://blog.csdn.net/qq_29721419/article/details/54428923

版权

Python——爬虫（解析简单标签）

# -*- coding: utf-8 -*-
# 使用BeautifulSoup解析网页
from bs4 import BeautifulSoup

#获取要解析的标签
with open('test.html','r',encoding='utf-8') as wb_data:
    Soup = BeautifulSoup(wb_data,'lxml');    #将要解析的文件传入
    print(Soup);    #打印读入Soup中的内容
    print("--------------\n")
    images = Soup.select('body > img');     #将要解析的标签元素路径传入
    urls = Soup.select('#binner > ul > li > a')     #可以从网站上直接复制
    print(images,urls,sep='\n---------------\n');      #打印解析标签元素包含内容
wb_data.close();

#解析标签内容-------使用get_text()获得文本内容,使用get('')方法获取标签属性值
list = [];
for image,url in zip(images,urls):
    data = {
        'image':image.get_text(),
        'image_src':image.get('src'),
        'url':url.get_text(),
        'url_href':url.get('hr

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小黄鸭and小黑鸭

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python——爬虫（解析简单标签）

Python——爬虫（解析简单标签）# -*- coding: utf-8 -*-# 使用BeautifulSoup解析网页from bs4 import BeautifulSoup#获取要解析的标签with open('test.html','r',encoding='utf-8') as wb_data: Soup = BeautifulSoup(wb_data,'lxm
复制链接

扫一扫