python爬虫教程（5）-BeautifulSoup解析网页

最新推荐文章于 2024-04-30 20:51:06 发布

Ejasmine

最新推荐文章于 2024-04-30 20:51:06 发布

阅读量1.4k

点赞数 6

分类专栏： python入门爬虫教程 python爬虫教程从入门到精通文章标签： BeautifulSoup python 网络爬虫网页解析 bs4

本文链接：https://blog.csdn.net/weixin_42183408/article/details/87459848

版权

欢迎来到python爬虫大讲堂，现在开始你的爬虫旅程吧！

使用BeautifulSoup解析

BeautifulSoup提供了从HTML中提取数据的功能，相对正则表达式来说，BeautifulSoup较为简单，所以放松！

安装

pip install bs4

使用BeautifulSoup获取日期

我们在上一篇文章中使用了正则表达式获取博客发布日期，这次我们使用BeautifulSoup来获取时间，首先获取一个：

import requests
from bs4 import BeautifulSoup
link='https://blog.csdn.net/weixin_42183408'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}
r=requests.get(link,headers=headers,timeout=20)

soup=BeautifulSoup(r.text,'lxml')
date=soup.find('span',class_='date').text.strip()

print('the date is',date)

这样你会得到类似于这样的结果：

the date is 2019-02-16 17:26:4

最低0.47元/天解锁文章

Ejasmine

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python爬虫教程（5）-BeautifulSoup解析网页

欢迎来到python爬虫大讲堂，现在开始你的爬虫旅程吧！使用BeautifulSoup解析BeautifulSoup提供了从HTML中提取数据的功能，相对正则表达式来说，BeautifulSoup较为简单，所以放松！安装pip install bs4使用BeautifulSoup获取日期我们在上一篇文章中使用了正则表达式获取博客发布日期，这次我们使用BeautifulSoup来获取时...
复制链接

扫一扫