- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 爬虫通过URL请求403错误
之前获取网站数据,本来是已经完成了,今天一试发现包403了。整理了一天先说主要代码import urllib.request# Cookie = "rxVisitor=15186102248518I5BJAVPSPA24S0U5I8RB59VE82158HN; CmLocation=100|100; CmProvid=bj; WT_FPC=id=2a5a17bd31f889e7e7...
2018-08-15 23:28:10 8922
原创 python url地址传json数据
import jsonimport requestsimport urllibfrom scrapy.http import Request, FormRequestdata ={'fileinfo':{'id':'XXXXXX','Name':'XXXX'}}values = urllib.parse.urlencode(data).encode(encoding='UTF8')h...
2018-08-13 18:26:11 3891
原创 URL中中文编码的问题
在做爬虫时需要确保附件的下载正确在操作中发现附件的下载地址存在中文,点击下载之后的链接是URL的编码格式中文:附件下载表:utf8编码: %E9%99%84%E4%BB%B6%E4%B8%8B%E8%BD%BD%E8%A1%A8gbk编码: %B8%BD%BC%FE%CF%C2网站的解析是gbk编码格式,如果直接复制下载地址,在地址栏下载,浏览器会自动转换为ut...
2018-08-09 18:43:03 635
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人