最近在使用python3的requests库下载PDF文件时出现了一个小问题:
我需要下载的其中一个PDF文件的url为https://www.aclweb.org/anthology/A00-2017
使用requests库下载的关键代码为:
file_name = url.split('/')[-1]
u = requests.get(url)
f = open(file_name, 'wb')
f.write(u.content)
f.close()
结果下载下来的文件显示为乱码,起初以为是编码的问题,查询了网页的编码显示的是“None”,因而不知道如何decode,最后试着改变了保存的文件名,在后面加上了“.pdf”,没想到问题就解决了-_-!