python3 下载PDF文件出现乱码

最新推荐文章于 2022-03-13 00:47:02 发布

Sometimes sun rises

最新推荐文章于 2022-03-13 00:47:02 发布

阅读量844

点赞数

分类专栏： python 文章标签： python pdf requests

本文链接：https://blog.csdn.net/qq_40828339/article/details/101173454

版权

4 篇文章 0 订阅

订阅专栏

最近在使用python3的requests库下载PDF文件时出现了一个小问题：

我需要下载的其中一个PDF文件的url为https://www.aclweb.org/anthology/A00-2017

使用requests库下载的关键代码为：

        file_name = url.split('/')[-1]
        u = requests.get(url)
        f = open(file_name, 'wb')
        f.write(u.content)
        f.close()

结果下载下来的文件显示为乱码，起初以为是编码的问题，查询了网页的编码显示的是“None”，因而不知道如何decode，最后试着改变了保存的文件名，在后面加上了“.pdf”，没想到问题就解决了-_-!

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注