Python抓取远程文件获取真实文件名

用urllib下载远程文件并转存到hdfs服务器,在下载时,下载地址中不一定包含文件名,需要从连接信息中获取。

 1     file_url = request.form.get('file_url')
 2     fo = urllib.urlopen(file_url)
 3     blob = fo.read()
 4     file_size = len(blob)
 5     if fo.info().has_key('Content-Disposition'):
 6         file_name = fo.info()['Content-Disposition'].split('filename=')[1] 7 file_name = file_name.replace('"', '').replace("'", "") 8 print '-in header' 9 else: 10 file_name= os.path.basename(file_url) 11 12 file_ext = get_file_ext(file_name.lower()) 13 remark = request.form.get("remark", '') 14 # 存储到hdfs

 

转载于:https://www.cnblogs.com/legendjslc/p/8652414.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值