爬虫02_bs4库01

最新推荐文章于 2024-07-27 12:20:46 发布

日朗格拉

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量67

点赞数

分类专栏：爬虫文章标签： python

本文链接：https://blog.csdn.net/weixin_41570413/article/details/107441626

版权

爬虫专栏收录该内容

7 篇文章 0 订阅

订阅专栏

BeautifulSoup入门

在这里插入图片描述

import requests
from bs4 import BeautifulSoup
url = 'http://python123.io/ws/demo.html'
r = requests.get(url,)
demo = r.text
soup = BeautifulSoup(demo, 'html.parser') #'html.parser'用于解析html的解释器
#soup = BeautifulSoup(open("D://demo.html"), 'html.parser')
# print(soup.prettify()) #输出树形结构
title = soup.title
tag = soup.a   #通过soup.<tag>的方式获取某个标签
soup.p.string
tag.attrs#返回一个字典
print(title,"\n",tag)
print(tag.attrs)
print(tag.attrs["href"])
print(soup.p.string)
print(tag.name) #a
print(tag.parent.name)#p
print(tag.parent.parent.name)#body

遍历

在这里插入图片描述

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

日朗格拉

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫02_bs4库01

BeautifulSoup入门import requestsfrom bs4 import BeautifulSoupurl = 'http://python123.io/ws/demo.html'r = requests.get(url,)demo = r.textsoup = BeautifulSoup(demo, 'html.parser') #'html.parser'用于解析html的解释器#soup = BeautifulSoup(open("D://demo.html"), '
复制链接

扫一扫