学习python的第十一天 Beautiful Soup 4

最新推荐文章于 2022-10-04 16:12:09 发布

有为青年……

最新推荐文章于 2022-10-04 16:12:09 发布

阅读量102

点赞数 1

分类专栏：自学python 文章标签： python

本文链接：https://blog.csdn.net/qq_41138009/article/details/105564411

版权

自学python 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

Beautiful Soup 4

学习python的第十一天（2020.04.16）

Beautiful Soup4（BS4）是Python的一个第三方库，用来从HTML和XML中提取数据。Beautiful Soup4在某些方面比XPath易懂，但是不如XPath简洁，而且由于它是使用Python开发的，因此速度比XPath慢。

BS4的安装

打开＋号，输入这两个安装就好了，非常简单，就不多说了。
在这里插入图片描述

BS4的用法（爬取百度实时热搜榜）

代码如下

#coding:utf-8
#coding: GBK
import requests
from  bs4 import BeautifulSoup
baidu_top=requests.get('http://top.baidu.com/buzz?b=1&fyb=PcReDianAla01').content.decode('GBK') #爬取网页
soup =BeautifulSoup(baidu_top,'lxml')
table =soup.find_all(class_='list-table')
title =soup.find_all(class_='list-title')
print("百度实时热搜：")
for a in  title:
    print(a.string)

运行结果

在这里插入图片描述

小小说明

BS4速度比XPath慢，但是它看上去比XPath更简单
今日就这样吧，学习，总没错的。

有为青年……

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习python的第十一天 Beautiful Soup 4

Beautiful Soup 4学习python的第十一天（2020.04.16）Beautiful Soup4（BS4）是Python的一个第三方库，用来从HTML和XML中提取数据。Beautiful Soup4在某些方面比XPath易懂，但是不如XPath简洁，而且由于它是使用Python开发的，因此速度比XPath慢。BS4的安装打开＋号，输入这两个安装就好了，非常简单，就不多说了...
复制链接

扫一扫