aini4568
码龄9年
关注
提问 私信
  • 博客:218,862
    218,862
    总访问量
  • 暂无
    原创
  • 915,476
    排名
  • 20
    粉丝
  • 0
    铁粉
  • 加入CSDN时间: 2016-03-18
博客简介:

aini4568的博客

查看详细资料
个人成就
  • 获得27次点赞
  • 内容获得0次评论
  • 获得210次收藏
创作历程
  • 35篇
    2019年
  • 56篇
    2018年
  • 142篇
    2017年
  • 91篇
    2016年
  • 11篇
    2015年
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python 多进程数量 对爬虫程序的影响

1. 首先看一下 python 多进程的优点和缺点  多进程优点: 1.稳定性好: 多进程的优点是稳定性好,一个子进程崩溃了,不会影响主进程以及其余进程。基于这个特性,常常会用多进程来实现守护服务器的功能。 然而多线程不足之处在于,任何一个线程崩溃都可能造成整个进程的崩溃,因为它们共享了进程的内存资源池。 ...
转载
发布博客 2019.09.12 ·
664 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 使用sort 对列表排序的性能测试

首先对一百万数据进行排序:    对一千万数据进行排序:    对一亿数据进行排序:            转载于:https://www.cnblogs.com/xuchunlin/p/11441160.html...
转载
发布博客 2019.09.01 ·
669 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用 python set 去重 速度到底是多快呢???

这次去测试一下 python 的set去重,速度怎么样?我们要做的是把文件一次性读取到内存中,然后去重,输出去重的长度。第一步:对121w 条数据去重,看去重话费的时间  上证据:      第二步:对1210 w 条数据去重,看去重话费的时间      第三步:对1.21 亿 条数据去重,看去重话费的时间      ...
转载
发布博客 2019.08.29 ·
577 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

搜狐视频 登录 md5 加密破解

这是一个简单的md5加密,可以学习一下js加密的破解流程,当一个入门级的教程第一步:请求抓包     password是32位的字母和数字组合,猜测可能是md5加密,我们md5在线工具上试一下          发现我们的猜测是完全正确的第二步:搜索js加密字段      第三步: 静态分析js,打断点    1.        2....
转载
发布博客 2019.08.29 ·
619 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大众点评评论数据抓取 反爬虫措施有css文字映射和字体库反爬虫

大众点评评论数据抓取 反爬虫措施有css文字映射和字体库反爬虫大众点评的反爬虫手段有那些:  封ip,封账号,字体库反爬虫,css文字映射,图形滑动验证码                    这个图片是滑动验证码,访问频率高的话,会出现这个滑动验证码                                              ...
转载
发布博客 2019.08.29 ·
734 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

python 实现 AES CBC模式加解密

AES加密方式有五种:ECB, CBC, CTR, CFB, OFB从安全性角度推荐CBC加密方法,本文介绍了CBC,ECB两种加密方法的python实现python 在Windows下使用AES时要安装的是pycryptodome 模块 pip install pycryptodomepython 在Linux下使用AES时要安装的是pycrypto模块pi...
转载
发布博客 2019.08.28 ·
1322 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

京东js加密 nloginpwd 破解

京东登录,有一个参数nloginpwd,是加密字段。第一步:浏览器抓包    第二部:搜索加密字段 js 代码    第三部: 下断点    2.     js代码:var navigator = {};var window = {};var Base64 = {};var ...
转载
发布博客 2019.08.28 ·
1666 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

某个新闻网站抓去自媒体账号 queryId js破解

第一步: 发现加密第二部:搜索加密参数 queryId  第三部:找到js核心加密代码第四部:代码实现window = {}function utf8ToBase64(t) { console.log(t) aa = window.btoa(unescape(encodeURIComponen...
转载
发布博客 2019.08.27 ·
145 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 实现 DES CBC模式加解密

# -*- coding=utf-8-*-from Crypto.Cipher import DESimport base64"""des cbc加密算法padding : PKCS5"""class DESUtil: __BLOCK_SIZE_8 = BLOCK_SIZE_8 = DES.block_size __IV =...
转载
发布博客 2019.08.28 ·
1487 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

python 实现 AES ECB模式加解密

AES ECB模式加解密使用cryptopp完成AES的ECB模式进行加解密。AES加密数据块分组长度必须为128比特,密钥长度可以是128比特、192比特、256比特中的任意一个。(8比特 == 1字节)在CBC、CFB、OFB、CTR模式下除了密钥外,还需要一个初始化向IV。(ECB模式不用IV)代码:  # -*- coding=utf-8-*-f...
转载
发布博客 2019.08.28 ·
866 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

计算机 KB,MB,GB,TB,PB,EB 计算

ASCII码:一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制,最小值-128,最大值127。如一个ASCII码就是一个字节。UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个...
转载
发布博客 2019.08.26 ·
1430 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

rsa 解密过程

直接扣js代码  $w = {};if (typeof $w.RSAUtils === 'undefined') var RSAUtils = $w.RSAUtils = {};var biRadixBase = 2;var biRadixBits = 16;var bitsPerDigit = biRadixBits;var biRadix = 1 &l...
转载
发布博客 2019.08.27 ·
208 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 验证码识别示例(四) 简单验证码识别

今天介绍一个简单验证的识别。主要是标准的格式,没有扭曲和变现。就用pytesseract 去识别一下。验证码地址:http://wsxf.mca.gov.cn/zfp/Random.cmd?d=1565452532947需要识别的验证码是:识别结果是:识别率百分之八十。10个有两个错误。识别代码:#coding:u...
转载
发布博客 2019.08.10 ·
254 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 验证码识别示例(五) 简单验证码识别

今天介绍一个简单验证的识别。主要是标准的格式,没有扭曲和变现。就用pytesseract 去识别一下。验证码地址:http://wscx.gjxfj.gov.cn/zfp/webroot/xfsxcx.html需要识别的验证码是:因为这个验证码有干扰点,所以直接识别的效果非常不好。首先对验证码进行二值化和降噪。效果如下:识别结...
转载
发布博客 2019.08.10 ·
495 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

信用中国(广西验证码二值化和降噪)

对于普通的字符型验证码,如果可以分割,那么降噪和二值化以后,就很容易识别了。这篇博客主演是对验证码进行降噪和二值化。下面的图片是处理前的验证码和处理后的验证码截图:下面是登录的验证码: 下面是验证码处理前后的对比 降噪代码不再附加转载于:https://www...
转载
发布博客 2019.08.07 ·
187 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python 验证码识别示例(三) 简单验证码识别

今天介绍一个简单验证的识别。主要是标准的格式,没有扭曲和变现。就用pytesseract 去识别一下。验证码地址:https://user.www.gov.cn/sso/verifyimg_edit?rd=0.22469390770687414需要识别的验证码是:识别结果是:识别代码是:#coding:utf-8from c...
转载
发布博客 2019.08.10 ·
221 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

unicode转换为中文

unicode转换为中文\u5f53\u5730\u65f6\u95f42019\u5e747\u670813\u65e5\uff0c\u82f1\u56fd\u8d1d\u5fb7\u798f\u7279\u90e1\u74e6\u827e\u6ce2\u65af\u987f\uff0c\u82f1\u56fd\u9996\u76f8\u70ed\u95e8\u5019\u90...
转载
发布博客 2019.07.22 ·
24482 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

烦人的警告 Deprecated: convertStrings was not specified when starting the JVM

python 调用java代码:  Deprecated: convertStrings was not specified when starting the JVM. The defaultbehavior in JPype will be False starting in JPype 0.8. The recommended settingfor new co...
转载
发布博客 2019.07.11 ·
767 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

人不成熟的五大特征:立即要回报、不自律、经常被情绪所左右、不愿学习、做事情不靠信念靠人言(你中了几条?)...

人不成熟的五大特征:立即要回报、不自律、经常被情绪所左右、不愿学习、做事情不靠信念靠人言(你中了几条?)转载自:管理晨读原文链接:https://mp.weixin.qq.com/s/qYIiYZy3S73bqONy08dsSg作者|张瑞敏来源|人民日报这个社会有很多的成年人,还没有脱离幼稚的行为,一点小事情就跟别人争来争去。1 人不成熟的...
转载
发布博客 2019.05.31 ·
194 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

使用 xpath helper 提取网页链接

需求是这样的,公司某个部门不会爬虫,不懂任何技术性的东西,但是希望去提取网页的一个分享链接,老大要求去开发谷歌浏览器插件,但一时半会也搞不定这个啊,想到用xpath helper 作为一个临时的替补方案;第一步:下载 安装 谷歌xpath helper 这个插件  chrome插件XPath Helper的下载与安装  参考教程https://blo...
转载
发布博客 2019.05.28 ·
553 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多