爬虫
文章平均质量分 92
南方的孩子
与有肝胆者共事,从无字句处读书
展开
-
如何将请求时的参数或者包体快速转换成字典形式
以百度搜索csdn为例# url后的参数如下s = """ie: utf-8f: 8rsv_bp: 1rsv_idx: 2tn: baiduhome_pgwd: csdnrsv_spt: 1oq: %E5%AF%8C%E5%AE%9D%E8%A2%8Brsv_pq: b95cb2150002353brsv_t: 6094e1L3QavAxng0GfZWmvEHgI+Cyt3...原创 2019-12-10 14:53:06 · 3826 阅读 · 5 评论 -
Xpath——text()内容定位
<html lang="en"><head> <meta charset="UTF-8"> <title>Title</title></head><body> <div class="class1"> <div class="class2"> ...原创 2019-12-04 10:20:30 · 26799 阅读 · 2 评论 -
猫眼爬虫-字体加密
引言最近又爬了一次猫眼的票房数据,发现其字体加密手段又加强了,在此记录一下分析字体源下载字体文件 从此处可以得到字体文件链接,下载下来分析字体文件不难发现每次请求,都会随机匹配一个字体文件先用fontEditor打开看看对比两次请求的字体文件,并无规律可寻利用TTfont将字体文件转成xmlfont = TTFont(woff_file)font.s...原创 2019-10-27 23:51:43 · 1523 阅读 · 7 评论 -
猫眼-字体训练
工具JDK,jTessBoxEditor是运行在java环境上的jTessBoxEditor:下载链接http://down2.opdown.com:8019/opdown/jTessBoxEditor.zip,下载解压,双击train.bat准备训练数据两份字体文件的数字图像操作步骤 Tools -> Merge TIFF生成tif文件全选,点击打开tif...原创 2019-10-27 23:47:31 · 1237 阅读 · 0 评论 -
selenium
selenium是一个浏览器自动化测试框架chorm浏览器驱动下载http://chromedriver.storage.googleapis.com/index.htmlchorm浏览器版本与驱动映射关系https://blog.csdn.net/zbj18314469395/article/details/100560044相关方法find_element_by_id...原创 2019-10-07 01:25:33 · 663 阅读 · 0 评论