4行代码实现python爬取网页源码

最新推荐文章于 2024-04-27 16:08:33 发布

牧文山

最新推荐文章于 2024-04-27 16:08:33 发布

阅读量605

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/weixin_42750611/article/details/109189099

版权

Python 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

以下使用requests模块从一个URL下载网页源码，从而进行爬虫的下一步分析。

#下载网页源代码
import requests
url  = "https://www.baidu.com/"
myfile = requests.get(url)
open("D:/code.txt","wb").write(myfile.content)

你只需使用requests模块的get方法获取URL，并将结果存储到一个名为“myfile”的变量中。然后，将这个变量的内容写入文件。

url  = "目标网址"

这里，可以修改目标网站。同时，将代码进行小改动也可以爬取网页图片，前提是这个网址本身是图片格式。

# 下载图片
import requests
html  = "http://inews.gtimg.com/newsapp_ls/0/12640396123_640330/0.png"
myfile = requests.get(html)
open("D:/3.png","wb").write(myfile.content)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

牧文山

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
4行代码实现python爬取网页源码

以下使用requests模块从一个URL下载网页源码，从而进行爬虫的下一步分析。#下载网页源代码import requestsurl = "https://www.baidu.com/"myfile = requests.get(url)open("D:/code.txt","wb").write(myfile.content)你只需使用requests模块的get方法获取URL，并将结果存储到一个名为“myfile”的变量中。然后，将这个变量的内容写入文件。url = "目标网址"
复制链接

扫一扫