python实战演练一：抓取我自己csdm博客信息的标题和文章链接，并存入文件夹《抓取信息》

最新推荐文章于 2023-01-11 15:54:42 发布

鹿鸣悠悠

最新推荐文章于 2023-01-11 15:54:42 发布

阅读量221

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/weixin_41665637/article/details/98870973

版权

python 专栏收录该内容

148 篇文章 4 订阅

订阅专栏

抓取我自己csdm博客信息的标题和文章链接，并存入文件夹

一、抓取信息

分析：
1、我们要找到自己所要抓取的链接的xpath
右键：检查元素-》xpath
在这里插入图片描述
代码：

from lxml import  etree#调用的函数
import requests #调用的函数
r=requests.get('https://blog.csdn.net/weixin_41665637').content#被测地址
topic=etree.HTML(r)
html=topic.xpath("//main/div/div/h4/a/@href")#抓取链接
title=topic.xpath("//main/div/div/h4/a/text()")#抓取标题
#
print(html)
print(title)

结果
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

鹿鸣悠悠

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python实战演练一：抓取我自己csdm博客信息的标题和文章链接，并存入文件夹《抓取信息》

抓取我自己csdm博客信息的标题和文章链接，并存入文件夹一、抓取信息分析：1、我们要找到自己所要抓取的链接的xpath右键：检查元素-》xpath代码：from lxml import etree#调用的函数import requests #调用的函数r=requests.get('https://blog.csdn.net/weixin_41665637').content#...
复制链接

扫一扫