2021-06-10

最新推荐文章于 2022-02-14 09:25:29 发布

孟文涛

最新推荐文章于 2022-02-14 09:25:29 发布

阅读量198

点赞数

分类专栏：爬虫 html 文章标签： python

本文链接：https://blog.csdn.net/weixin_45058736/article/details/117771794

版权

爬虫同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

html

1 篇文章 0 订阅

订阅专栏

f=urllib.request.urlopen(‘http://jingyan.baidu.com/article/455a9950bc94b8a166277898.html‘)
response=f.read()

#python3

from bs4 import BeautifulSoup

html='''<html>

<head>

<title class='ceshi'>super 哈哈 star</title>

</head>

<body>

爬虫入门

<p class='sister'>

是不是

</p>

</body>

</html>'''

#用BeautifulSoup解析数据 python3 必须传入参数二'html.parser' 得到一个对象，接下来获取对象的相关属性

html=BeautifulSoup(html,'html.parser')

# 读取title内容

print(html.title)

# 读取title属性

attrs=html.title.attrs

print(attrs)

# 获取属性attrs['class'] ---->['ceshi'] 这是一个list 通过下标可以获取值

print(attrs['class'][0])

# 读取body

print(html.body)

读取数据还可以通过BeautifulSoup的select方法

html.select()

#按标签名查找

soup.select('title')

soup.select('body')

# 按类名查找

soup.select('.sister')

# 按id名查找

# p标签中id为link的标签

soup.select('p #link')

#取标签里面的值

soup.p.string

#取标签里属性值通过href获取

html['href']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

孟文涛

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Eclipse 2021-06 J2EE 最新版,免安装，支持JDK16

07-21

有钱捧个钱场，没钱捧个人场清华大学的镜像：https://mirrors.tuna.tsinghua.edu.cn/eclipse/technology/epp/downloads/release/2021-06/R/eclipse-jee-2021-06-R-win32-x86_64.zip

2021-01-06

qq_40504996的博客

01-06

958

运行机某个js文件访问不了。做了过滤器，没有被过滤的。其他js文件都可以。就单独一个403。考虑是否是防火墙做了一些敏感词的判断过滤。将js文件名修改试一下，或者从防火墙那方面做文章 ...

参与评论您还未登录，请先登录后发表或查看评论

Eclipse（2021-06）配置jdk和Tomcat

qq_46102212的博客

02-14

1147

三处地方配置jdk 进入设置选择自己相应的jdk文件夹路径配置Tomcat 修改编码完成

2021-06-07~2021-06-11总结（MySQL）

weixin_43160903的博客

06-13

1548

2021-06-07~2021-06-11工作总结工作内容技术探索1.浅谈MySQL1.1 MySQL的引擎1.1.1 InnoDBInnoDB行锁模式及加锁方式：1.1.2 MyisamMyISAM只有表锁，且没有事务。1.1.3 MySQL的锁机制1.1.4 MySQL 的 B+Tree1.2 数据类型：1.2.1 数值类型：1.2.2 字符串类型：1.2.3 时间日期类型：总结工作总结工作内容本周的工作内容主要是对之前所实现功能的bug进行修改，主要的问题为三个平台之间流程、权限。这就要求在最初

2021-01-10

qq_22667507的博客

01-10

1052

jupyter notebook中直接安装python的第三方库。例如安装pymysql ： ! pip install pymysql。升级pip：

2021-06-30

perfect_ch的博客

06-30

3243

目标检测网络构成部分: detector=backbone + neck + head backbone部分的网络就是负责从图像中提取特征。 neck是放在backbone和head之间的，是为了更好的利用backbone提取的特征。 head这一部分的作用就是用于分类+定位。 backbone: VGG ResNet (ResNet18, 50, 100) ResNext DenseNet SqueezeNet Darknet (Darknet19,53) MobileNet ShuffleNe

2021-06-01

热门推荐

weixin_51977690的博客

06-01

3万+

NB-IOT(窄带物联网总结) 1.NB-IOT 所谓NB-IOT就是窄带物联网（Narrow Band Internet of Things, NB-IoT），构建于蜂窝网络，只消耗大约180KHz的带宽，可直接部署于GSM、UMTS或LTE网络，是IoT领域一个新兴的技术，支持低功耗设备在广域网的蜂窝数据连接，也被叫作低功耗广域网(LPWAN) 2.NB-IOT设计目标 2.1如何增强覆盖覆盖：就是最大耦合损耗（MCL），从基站无线端口到终端天线端口的路径损耗。 提高上行功率谱密度在相同的发射

2021-10-06

崔斐然的CSDN啊CuiFeiran

10-06

3971

Jellyfin 使用影片内部片段做封面登陆主页-控制台-媒体库点击管理媒体库在出现的画面中 Movie 图片获取程序选择Screen Grabber，勾选最下方的解压剧情图片保存配置后-回到图中位置选扫描媒体库-覆盖或扫描缺失文件 ...

Eclipse 2021-6安装教程及其安装包

m0_54130475的博客

07-29

9631

eclipse是基于Java的开发软件，想装eclipse先装Java jdk，安装包在最后。一、安装Java JDK （14.0.2）到软件目录下找到jdk-14.0.2_windows-x64_bin.exe 双击打开，点击下一步这是安装路径，可以默认也可以更改。不更改点击下一步，想改点击更改。由于我C盘空间不多了，我安装到了E盘，点击更改，选择安装位置，选完点击确定，然后下一步然后点击下一步直至安装完成安装完成后，此电脑右键属性，高级系.

2021-01-18

weixin_54641072的博客

01-18

1894

找程序猿哥哥！！！！编制App或者小程序

2021-06-18

darkerv的博客

06-18

7609

安装idea 无法启动，Failed to load JVM DLL\bin\server\jvm.dll方案一方案二解决办法方案一 1、系统可能没有安装Microsoft Visual C++ 2010 Redistributable Package 2、jdk与idea架构不对应，例如：jdk 是 64位，idea是32位。这是网上常见的解决办法，你们可以试试，我的情况这两种没有用方案二这是我自己遇到的情况，只能用管理员启动，但是用管理员启动，是破解不了idea的。解决办法卸载IDEA（卸

eclipse-jee-2021-06-R-win32-x86_64.zip

07-10

标题中的"eclipse-jee-2021-06-R-win32-x86_64.zip"表明这是2021年6月发布的Eclipse IDE版本，适用于Windows 64位操作系统。"win32-x86_64"这部分可能有些误导，因为"win32"通常指代32位系统，但在这里可能是为了...

eclipse-java-2021-06-R-win32-x86_64

07-10

【标题】"eclipse-java-2021-06-R-win32-x86_64" 提供的是Eclipse IDE（集成开发环境）的一个特定版本，专为Java开发者设计，适用于Windows操作系统32位x86_64架构。这个版本是在2021年6月发布的，通常称为R版本，...

eclipse-jee-2021-06-R-linux-gtk-aarch64.tar.gz

07-10

标题中的“eclipse-jee-2021-06-R-linux-gtk-aarch64.tar.gz”指示了这是一个针对企业级Java和Web开发者设计的Eclipse集成开发环境（IDE）的版本，适用于Linux操作系统AArch64架构。Eclipse IDE是世界上最流行的开源...

eclipse-jee-2021-12-R-win32-x86_64.zip

01-05

Eclipse IDE for Enterprise Java and Web Developers （eclipse-jee-2021-12-R-win32-x86_64.zip）适用于Windwos x86_64

eclipse-cpp-2021-06-R-win32-x86_64.zip

08-31

【标题】"eclipse-cpp-2021-06-R-win32-x86_64.zip" 指的是Eclipse IDE的一个特定版本，面向C/C++开发者的2021年6月发布版，适用于Windows 32位和64位操作系统。这个压缩包包含了运行Eclipse IDE所需的全部组件，...

eclipse-cpp-2021-06-R-linux-gtk-aarch64.tar.gz

09-01

首先，我们来看标题中的"eclipse-cpp-2021-06-R-linux-gtk-aarch64.tar.gz"，这是一个针对2021年6月发布版本的Eclipse IDE的压缩包，特别为Linux的AArch64（也称为ARM64）体系结构设计。AArch64是ARM公司的一种64位...

eclipse-java-2021-06-R-win32-x86_64.zip

07-01

标题 "eclipse-java-2021-06-R-win32-x86_64.zip" 提供的信息表明这是一款适用于Windows 32位系统的Eclipse IDE（集成开发环境）的版本，专为Java开发者设计，发布于2021年6月。Eclipse是一个开源的软件开发平台，它...

科技园区弱电智能化系统设计方案[2021-06-10]（75页）.pdf

05-21

此方案以2021年6月10日为基准，共有75页，涵盖了多个子系统的设计与集成。 1. **整体思路**：设计的核心理念是系统集成，而非简单的智能产品堆砌。目标是创建一个既符合当前需求，又能适应未来发展的智能化系统。...

java 2021-06-10时间字符串转年月日