python网上批量下载表格_python读取表格链接批量下载Html文件

#导入库

import urllib.request

#获取单个html文件内容

def getHtml(url):

html=urllib.request.urlopen(url).read()

return html

#将html文件重新命名,保存到指定位置

def saveHtml(file_name,file_content):

#注意Windows文件命名的禁用符,比如/

with open(file_name.replace('/','_')+".html","wb") as f:

f.write(file_content)

#写文件用bytes而不是str,所以要转码

#读取csv格式的文件,只读

f = open("commed.csv","r")

count=1

#读取每一行的数据,每一行的数据逐一处理

for line in f:

count=count+1

a=[]

a.append(line.strip().split(","))

site=a[0][0]

if len(site) > 10:

#满足条件后,将读取的每一个网址信息,进行访问保存,重新命名保存到本地

title="commed\\"+str(count)+"行"+a[0][1]

html=getHtml(site)

saveHtml(title,html)

#打印输出确认是否保存成功,显示当前处理数据的行数

print("下载成功"+"===第"+str(count)+"行")

#关闭文件读取函数

f.close()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值