初学爬虫（一）：编写第一个爬虫程序：获取页面、提取需要的数据、如何精准定位标题的HTML代码位置、存储数据

最新推荐文章于 2024-05-07 15:53:56 发布

caroline_richboom

最新推荐文章于 2024-05-07 15:53:56 发布

阅读量1.8k

点赞数 1

分类专栏：爬虫文章标签： python 编程语言爬虫

本文链接：https://blog.csdn.net/qq_45154565/article/details/109440275

版权

注意：
爬虫是需要基础python知识的，若没有学习过python，可见我的python入门使用系列博客：python入门使用（一）：运行方式and基本命令

下面以爬取我的博客python入门使用（一）：运行方式and基本命令为例来获取文章的标题名称：

1、获取页面

import requests #引入包requests
link = "https://blog.csdn.net/qq_45154565/article/details/109261945" #将目标网页的网址定义为link

# 定义请求头的浏览器代理，伪装成火狐浏览器
headers = {
   'User-Agent' : 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'} 

r = requests.get(link, headers= headers) #请求网页，r是requests的response回复对象，可以从中获取想要的信息
print (r.text)  #r.text是获取的网页内容代码

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

caroline_richboom

关注关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
初学爬虫（一）：编写第一个爬虫程序：获取页面、提取需要的数据、如何精准定位标题的HTML代码位置、存储数据

注意：爬虫是需要基础python知识的，若没有学习过python，可见我的python入门使用系列博客：python入门使用（一）：运行方式and基本命令
复制链接

扫一扫