学习python的第七天 结合requests与正则表达式(爬网页)

本文是作者学习Python的第七天记录,利用requests库和正则表达式爬取个人博客的标题、时间及阅读量。通过实践操作,展示了简单的网页爬取过程,旨在检验本周学习成果。
摘要由CSDN通过智能技术生成

结合requests与正则表达式

学习python的第七天(2020.04.12)

本想今天周末偷偷懒,可是实在没事情做,没有女友,不想玩游戏,刚看完士兵突击,两天,人活着就是为了要做有意义的事,学python我想就是做有意义的事,写博客也是做有意义的事。加油,成为一个成功的男人,得自律,加油少年。
今天就检验自己本周的学习情况

知识梳理

爬我自己的博客(https://blog.csdn.net/qq_41138009),从中获取标题、时间、阅读量。很简单,在这里插入代码片以后也能用,感谢大家的阅读。也能自勉!(ง •_•)ง

网页图片

在这里插入图片描述

代码如下
#coding:utf-8
#coding:GBK
import re
import requests
my_bo =requests.get('https://blog.csdn.net/qq_41138009').content.decode()
title=re.findall('原创</span>        (.*?)      </a>',my_bo,re.S)
time =re.findall('<span class="date">\\n        (.*?)</span>',my_bo,re.S)
read =re.findall('阅读数 <span class="num">(.*?)</span>',my_bo,re.S)
print('标题',title)
print('时间',time)
print('阅读量',read)


运行结果

在这里插入图片描述

小小说明

今日周末,确实偷懒了,明天得加油干。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值