- 博客(19)
- 资源 (5)
- 问答 (15)
- 收藏
- 关注
原创 json.loads()报错处理
# coding=utf-8import json, rea = '''{"bulletAttributes":["A-line silhouette with a relaxed fit.","High waisted.","Hits at the upper calf.","Model is 5'9" (176 cm), size S, wearing a regular Gap s...
2019-08-29 11:56:39 2025
原创 分布式爬虫管理框架
ScrapydGitHub:https://github.com/scrapy/scrapydGerapyGitHub:https://github.com/Gerapy/Gerapy推荐链接:https://cuiqingcai.com/4959.html
2019-08-28 14:14:19 358
原创 xpath 获取某个标签下的所有子节点
//div[@class="main"]//span[@id="address"]//d | //e或者//div[@class="main"]//span[@id="address"]/*
2019-08-28 10:31:59 18434 4
转载 python定时任务
原文:https://www.cnblogs.com/wanglinjie/p/9286323.htmlimport schedule 2 import time 3 4 def test(): 5 print("I'm working...") 6 def test2(): 7 print("I'm working... in job2") 8 ...
2019-08-27 12:00:01 80
原创 字体反爬解决方案
因本人写的pdf文档,懒得再这里重写一遍,就放个百度云链接把包含svg矢量图 和 字体两种方案,字体里又包含两种解析方案链接:https://pan.baidu.com/s/1BYqTzyY0qWCWxKOOrMwtog提取码:12gt有不对的地方,还请指教!!!若提示提取码过期,请留言...
2019-08-22 16:46:47 226
原创 汉字生成woff字体文件
# coding=utf-8import codecsfrom fontTools import unichr# 生成所有汉字信息# start,end = (0x4E00, 0x9FA5) # 汉字u编码范围 16进制的# with codecs.open("chinese.txt", "wb", encoding="utf-8") as f:# for codep...
2019-08-22 10:43:37 1323
原创 自定义字体文件解析成人眼可识别文字
# coding=utf-8from fontTools.ttLib import TTFontfrom PIL import Image, ImageDraw, ImageFont #绘制图片import numpy, os, platformimport pytesseract #文字识别库,这个包的安装还需要安装tesseract.exe,可以网上搜教程# coding=...
2019-08-21 16:18:52 669
原创 python读取字体文件,转成xml并解析xml数据
# coding=utf-8from fontTools.ttLib import TTFontworld = TTFont('898a472b.woff')# 读取响应的映射关系uni_list = world['cmap'].tables[0].ttFont.getGlyphOrder() # 'cmap' 表示汉字对应的映射 为unicode编码print(uni_list)...
2019-08-20 18:52:36 2735 1
原创 python实现拍拍贷 rsa 加密 及 python普通rsa加密方式
普通加密方式之一:# coding=utf-8import rsaimport binascii, base64# 使用网页中获得的n和e值,将明文加密def rsa_encrypt(rsa_n, rsa_e, pwd): # 用n值和e值生成公钥 key = rsa.PublicKey(rsa_n, rsa_e) print('key = ', key) ...
2019-08-19 17:07:48 450
原创 python获取指定日期内的所有日期,所有月份, 前几分钟、前几天
# coding=utf-8import datetimefrom datetime import timedeltadef gen_dates(b_date, days): day = timedelta(days=1) # print(day) for i in range(days): # print(b_date + day*i) ...
2019-08-16 10:46:55 6512 1
原创 爬虫加密参数:一号店 登陆密码 rsa加密调试
入口地址:https://passport.yhd.com/passport/login_input.dovar navigator = {};var window = this;var JSEncryptExports = {}; (function(a6) {var dQ;var dg = 244837814094590;var dE = ((dg & 16777215)...
2019-08-15 18:02:48 1165
原创 charles抓包参数格式化输出
新建个 00.txt 文件,直接复制粘贴进去,然后运行,结果就是像个字典样式的输出,再复制粘贴到代码里,省的一行行手动添加引号,都好啥的。datas = open('00.txt', 'r', encoding='utf-8')datas = datas.readlines()print('{')for data in datas: print('"%s": "%s",' % ...
2019-08-15 10:52:13 858
转载 [Python3网络爬虫开发实战] 7.3-Splash负载均衡配置
转载:静觅»[Python3网络爬虫开发实战] 7.3-Splash负载均衡配置原文地址:https://cuiqingcai.com/5654.html用Splash做页面抓取时,如果爬取的量非常大,任务非常多,用一个Splash服务来处理的话,未免压力太大了,此时可以考虑搭建一个负载均衡器来把压力分散到各个服务器上。这相当于多台机器多个服务共同参与任务的处理,可以减小单个Splas...
2019-08-13 15:40:40 141
转载 转载:常见加密方式和Python实现
原文地址:https://www.jianshu.com/p/4ba20afacce21. 前言我们所说的加密方式,都是对二进制编码的格式进行加密的,对应到Python中,则是我们的Bytes。所以当我们在Python中进行加密操作的时候,要确保我们操作的是Bytes,否则就会报错。将字符串和Bytes互相转换可以使用encode()和decode()方法。如下所示:# 方法...
2019-08-08 10:35:03 149
原创 爬虫rsa加密参数
# coding=utf-8from urllib.parse import quoteimport requests, js2py, base64import execjsdef getpwd(pw): cx = ''' function setMaxDigits(n) { maxDigits = n; ZERO_ARRAY = new Array(...
2019-08-06 17:25:45 435
原创 python rsa加密
原文地址:https://www.programcreek.com/python/example/83019/rsa.PublicKeydef get_pwd_rsa(self,pwd,servertime,nonce): “”” 获取rsa2加密密码,使用https://pypi.python.org/pypi/rsa/3.1.1中的RSA模块,可以访问以...
2019-08-06 15:15:44 463
原创 写爬虫遇到 AES 加密参数
本次涉及三个网站:分别以编号 1 2 3 表示,文中所有1 2 3 分别代表三个网站1:https://www.jidaihome.com2.http://www.qhce.gov.cn/login.jsp3:https://web.ewt360.com/register/#/login?_k=zb7fzw通过分析网站得知:1:填充方式为Pkcs7; 加密模...
2019-08-01 21:01:37 2492
原创 zhi_ping_tong pwd加密破解及python执行js代码
地址:http://zp.job5156.com/login/com可以看见搜出来很多password。笨方法:一个个点开看看,感觉是的话,打个断点,一般能打断点的就是,打不了断点的可能就不是,这个地方不怎么清楚,还请大佬指教!!会发现此时可以多打几个断点试试这个就是加密后的结果。可以一步步调试js,会发现 string就是明文密码,keyPai...
2019-08-01 15:59:15 297
django-vue-admin 依赖包
2022-04-23
python import rsa 运行报错
2019-08-08
scrapy设置代理 IP 无法爬去
2018-10-08
plt 绘图 x 轴 y 轴 数据设置
2018-08-21
python plt 绘图 问题
2018-08-14
[WinError 10053] 你的主机中的软件中止了一个已建立的连接。
2018-07-01
selenium + 火狐 打开浏览器不能输入中文
2018-06-23
lingo 分析出来的数据 怎么直接存到 mysql 数据库
2018-06-22
python 保存excel文件 到 http://192.168.1.10
2018-06-12
火狐浏览器自动保存请求头信息,cookie信息到本地文件,
2018-06-08
python爬虫制作接口怎么做
2018-06-05
爬虫 JSESSIONID 问题
2018-05-30
python excel 某个单元格点击鼠标右键,定义名称
2018-04-27
python 处理excel 批量添加 定义名称
2018-04-25
爬虫 UnboundLocalError
2017-12-01
爬虫 抓取 内容 时有时无
2017-12-01
TA创建的收藏夹 TA关注的收藏夹
TA关注的人