爬虫
tobin liao
小白一个,
展开
-
python 下载文件并打包
根据附件地址去下载附件,然后打包zip,返回打包文件名。1.根据附件url地址request去下载到本地。主要利用request和zip模块。2.zipfile模块打包下载文件。原创 2023-04-26 17:53:26 · 673 阅读 · 0 评论 -
爬虫报错返回403状态
返回403错误码,权限限制,一般来说政府网站不用登入,但也有权限限制,这一般是请求头缺少了。Network -> 选择对应请求-> Heaers -> Request Header。F12开发者模式,请求相关连接,查看请求的请求头复制即可。如上面代码,把User-Agent去掉之后就可解决。也可能是缺少其他的字段。查看其他请求头字段方式。原创 2023-04-18 22:04:44 · 854 阅读 · 0 评论