Python 爬虫入门(1)获取豆瓣网页源代码

最新推荐文章于 2024-04-15 19:12:02 发布

爱吃小青菜.

最新推荐文章于 2024-04-15 19:12:02 发布

阅读量1.7k

点赞数 3

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73473737/article/details/127542439

版权

import urllib.request #引入第三方模块

url = "http://www.douban.com" #每一个网页都有一个唯一的名称标识通常称为URL

headers = {"User-Agent":"......"} #模仿正常网页访问时，提供计算机ip 地址 (反爬虫的第一步)

#user-agent 的查找方式: 按F12 点击网络(network) 点击标头(head) 滑到最下面就会发现你电脑的具体ip地址

date = bytes(urllib.parse.urlencode({"name":"eric"}),encoding="utf-8") #date=bytes 将数据转化成二进制数字包 ; urllib.parse 解析url; urlencode 用于封装数据发送给爬取的网址;encoding="utf-8" 编译方式。

req=urllib.request.Request(url=url,date=date,headers=headers)

# 发出请求信息其中: req 为一个对象 urllib.request 为引入的一个包 Request封装了浏览器向服务器发送请求的信息

response = urllib.request.urlopen(req)

#封装服务器发给浏览器的响应信息 (服务器指对面的,浏览器是我自己模拟的)

print(response.read().decode(

最低0.47元/天解锁文章

爱吃小青菜.

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python 爬虫入门(1)获取豆瓣网页源代码

爬虫初步
复制链接

扫一扫

爱吃小青菜. CSDN认证博客专家 CSDN认证企业博客

码龄2年

6: 原创

159万+: 周排名

189万+: 总排名

2779: 访问

: 等级

91: 积分

3: 粉丝

8: 获赞

3: 评论

7: 收藏

私信

关注

热门文章

最新评论

计算二叉树深度 (详解递归的具体每一步)
fxgvvddd: 老哥你真牛
创建一棵二叉树(并对其进行三种遍历和删除二叉树
CSDN-Ada助手: 恭喜你写了这么棒的博客！创建一棵二叉树并对其进行遍历和删除确实是非常重要的基础知识。我建议您在下一步的创作中，可以探讨一些更高级的二叉树操作，例如平衡二叉树或红黑树。希望您能继续保持创作热情，为我们带来更多优质的技术分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply5 看奖励名单。
计算二叉树深度 (详解递归的具体每一步)
CSDN-Ada助手: 非常感谢您分享这篇博客，对于递归的具体实现步骤进行详细的讲解，让我受益匪浅。祝贺您在博客创作上的不断努力和进步。建议您可以在下一篇博客中，介绍一些其他数据结构或算法的实现方式，以便我们能够更全面地了解它们的应用场景和实现方法。期待您的下一篇精彩博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。