Python 爬取网页并存储至本地

Python 爬取网页并存储至本地

使用Python爬取网页,并将该网页存储至本地目录。

注:本文爬取的是网易新浪的一个网页。

代码如下:

import urllib.request 

def getHTML(url):  
     html = urllib.request.urlopen(url).read()   
     return html
  
def saveHTML(file_name, file_content):  
     # 注意windows文件命名的禁用符,比如 /   
     with open(file_name.replace('/', '_') + ".html", "wb") as f:  
            # 写文件用bytes而不是str,所以要转码   
            f.write(file_content) 


aurl = "https://mil.news.sina.com.cn/2019-06-27/doc-ihytcerk9733591.shtml"

html = getHTML(aurl)
print("网页已爬取")

saveHTML("sina", html)
print("网页已存储至本地")

目标网页如下:爬取的网页

网页爬取结果如下:(在VSCode下打开)VSCode中打开爬取的网页(本地存储)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

视觉闫小亘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值