Python爬虫-从基础到大神——（基础的获取网站数据操作）

最新推荐文章于 2024-05-03 14:23:24 发布

迷途的流星雨

最新推荐文章于 2024-05-03 14:23:24 发布

阅读量182

点赞数 1

分类专栏： python 文章标签：爬虫 Python

本文链接：https://blog.csdn.net/weixin_44203308/article/details/88700973

版权

python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

import requests

# 定义需要爬取的网站，这里选取了百度的一个产品页面。
base_url = "https://www.baidu.com/more/"

# 使用requests请求网址,并接收网页,返回的是状态码
response = requests.get(base_url)

# 获取网页信息,接收的是文本信息
# html = response.text

# 接收的是二进制数据类型
# html = response.content

# 获取二进制（bytes)类型的页面并解码，从bytes类型转变为字符串类型
html = response.content.decode("utf-8")

# 存储到指定的文件中
with open("baidu.html", "w", encoding="utf-8") as f:
    f.write(html)  # html 必须是字符串才能写入

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

迷途的流星雨

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫-从基础到大神——（基础的获取网站数据操作）

import requests# 定义需要爬取的网站，这里选取了百度的一个产品页面。base_url = "https://www.baidu.com/more/"# 使用requests请求网址,并接收网页,返回的是状态码response = requests.get(base_url)# 获取网页信息,接收的是文本信息# html = response.text# 接收...
复制链接

扫一扫