Python
Marvel__Dead
这个作者很懒,什么都没留下…
展开
-
本地DLL通用验证码识别/滑块识别/文字点选/图标点选/推理/OCR文字识别
背景验证码识别一直都是一个重要的话题,近日总有一些公司问我 本地DLL验证码识别定制的事,可以联系QQ:【167231471】定制本地离线DLL验证码识别。另外给大家普及一下通用验证码识别和滑块缺口检测的解决方案【网易、极验、腾讯滑块】返回坐标:点击进入无限打码OCR网站识别通用验证码如果需要识别滑块,请参考官网OCR的开发文档其它:本地DLL验证码识别如 文字点选、图标点选、OCR文字识别等请联系QQ:167231471import jsonimport requests# 待识别的验证原创 2020-09-01 22:26:29 · 12210 阅读 · 0 评论 -
Python Java 滑块识别-通杀滑块
遇到滑块问题在写爬虫的时候,经常会遇到滑块问题,很多次都想过尝试如何攻破滑块,但是每次都没成功,除了最开始的极验滑块,当时通过原图和滑块图的对比,能够得出缺口坐标,但是随着极验、网易、腾讯滑块的更新,已经不能够找到原图了,下面给出滑块通杀的解决方案。尝试攻破滑块在这里介绍一款通杀滑块的平台,不过需要开通VIP,VIP是永久的,可以无限次识别,我在这里开通了永久VIP,花了99RMB,平台后面也会推出点选供VIP使用。平台地址:www.51learn.vip网站名称是【无限打码】,可以直接百度到。原创 2020-08-01 19:22:49 · 68407 阅读 · 0 评论 -
数字+字母 通用验证码图片识别 无限识别
背景最近在研究验证码图片识别,主要是字母+数字类型的验证码图片,找到了很多方法,但是大多都需要自己去通过深度学习自己训练,而且深度学习代码又看不懂。运气好,找到一个完整的深度学习代码能够去自己训练验证码图片识别,不需要看懂代码,直接拿来用,但是当遇到要识别验证码时,又需要时间去训练,训练出来识别率又不高。机缘巧合下,google到了一个验证码识别神器,而且是无限次数识别的。网址是:www.51learn.vip上代码,直接识别验证码尝试识别验证码图片:import jsonimport requ原创 2020-06-10 17:04:57 · 8659 阅读 · 3 评论 -
Python中的random模块
Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。random.random()random.random()用于生成一个0到1的随机浮点数: 0 <= n < 1.0random.uniform(a, b)random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随...转载 2018-02-25 23:12:39 · 341 阅读 · 0 评论 -
Java和Python中的编码解码
# 注:\x為十六進制str_str = &amp;quot;中&amp;quot;# 編碼為 utf-8,返回為bytes類型str_bytes = str_str.encode(&amp;quot;utf-8&amp;quot;)# 獲取byte數組,相當於Java的byte數組str_list = []for x in str_bytes: print(x) str_list.append(x)原创 2018-10-02 23:25:55 · 1081 阅读 · 0 评论 -
\r和\n的作用
\r : return 到当前行的最左边。\n: newline 向下移动一行,并不移动左右。Linux中\n表示回车+换行;Windows中\r\n表示回车+换行。Mac中\r表示回车+换行。...原创 2018-10-03 09:10:05 · 1457 阅读 · 0 评论 -
python中的索引规则
python中的索引很有趣,它可以用于列表、元組、字符串。在列表list = [1, 2, 3, 4, 5, 6, 7 ]中 print ("list[1:5]: %s " % list2[1:5]) 结果为 list[1:5]: [2, 3, 4, 5] 即在数组中第一个元素的索引值为0以此类推,其索引的特征是包含起点,但是不包含结束的索引值,所以实际输出结果为1到4号元素。执行print ...原创 2018-10-03 11:38:00 · 4352 阅读 · 0 评论 -
python中print的幾種輸出方式
# 第一種輸出方式print("我是第一種輸出方式。")# 第二種輸出方式# 默認sep=" "print("我是第二種", "輸出方式")print("我是第二種", "輸出方式", sep="")# 第三種輸出方式print("我是第三種%s" % "輸出方式")# 第四種輸出方式print("我是原创 2018-10-03 12:00:25 · 751 阅读 · 0 评论 -
Python中else的用法总结
本文讨论Python的for…else、while…else、try…except…else等语法Python中的for、while是在循环体内没有break语句、没有return语句,或者没有异常出现时才执行else语句,try…except…else是在try中无异常产生时执行,注意不包括continue。总的来说,是for、while、try语句中‘没毛病’时才执行,而在if…else...转载 2018-10-03 14:28:25 · 865 阅读 · 0 评论 -
【探究】Python可變類型和不可變類型ID的變化
# 不可變類型print("#"*50)print("不可變類型:")print("元組測試:")tuple_01 = (123, 456)print("tuple_01的數據為:【%s】 ID為:【%s】" % (tuple_01, id(tuple_01)))tuple_01 = (123, 456)print("修改後:")print("tuple_01的數據為:【%s】 .原创 2018-10-04 16:22:27 · 294 阅读 · 0 评论 -
Python字典的key不只可以是字符串
Python中不可變類型可以為字典的key。也就是說,數字類型(int、float、bool、complex)、字符串、元組 都可以為Python字典的key。其中的原理就是,當進行 map_01[“hello”] = “hello world” 增加字典元素時,字符串key,"hello"會在字典底層被傳入hash(object)函數返回一個唯一的hash值。而這個hash(object)函...原创 2018-10-04 16:59:15 · 17457 阅读 · 0 评论 -
Python兩個變量交換值【同時賦值的原理】
'''同時賦值的原理就是,等號右側是一個元組而元組定義后都會在內存中創建一個地址,並且保存元組元素的地址,Python中每一個類型都是對象,也都是地址。所以,當定義(a, b)元組后,實際上,內存中元組保存的元素是每個值的地址而等號左側之所以能得到值,是因為Python有一個獨特的賦值方式,那就是會把等號右側元組中的值,依次按索引把地址賦值給左側的變量。'''見代碼:# 測試元...原创 2018-10-05 18:17:31 · 1106 阅读 · 0 评论 -
python文件操作
文件基礎操作:文件操作類型分為:文本操作、二進制操作Python文件操作方法:打開文件。方法:open(“文件路徑”, “操作模式”),返回一個可操作的文件對象。讀寫文件。根據open方法返回的文件對象,可調用的方法:read([size:讀取的長度,默認讀整個文件]),返回值為字符串或者bytes。write(“字符串或者bytes”)關閉文件。根據open方法返回的文件對象,可調用...原创 2018-10-21 18:18:00 · 520 阅读 · 0 评论 -
代碼量統計程序
from os import listdirfrom os import sepfrom os import getcwdfrom os import path as opathclass CodeStatistic(object): num_code = {} code_state = {} def __init__(self, *formats): ...原创 2018-10-24 11:00:50 · 503 阅读 · 1 评论 -
Python内置函数(8)——bytes
原型:class bytes([source[, encoding[, errors]]])说明:返回值为一个新的不可修改字节数组,每个数字元素都必须在0 - 255范围内,和bytearray函数的具有相同的行为,差别仅仅是返回的字节数组不可修改。当3个参数都不传的时候,返回长度为0的字节数组>>> b = bytes()>>> bb''&g...转载 2018-11-27 11:41:29 · 851 阅读 · 0 评论 -
Python捕获异常
一、常见异常总结1.SynataxError:语法错误2.NameError:试图访问的变量名不存在3.IndexError:索引错误,使用的所以你不存在,常为索引超出序列范围4.KeyError:使用了映射中不存在的关键字(键)时引发的关键字错误5.TypeError:类型错误,内建操作或是函数应于在错误类型的对象时会引发类型错误6.ValueError:值错误,传给对象...转载 2018-02-25 22:51:33 · 2391 阅读 · 0 评论 -
python中类变量与成员变量的使用注意点总结
前言最近在用python写一个项目,发现一个很恶心的bug,就是同由一个类生成的两个实例之间的数据竟然会相互影响,这让我非常不解。后来联想到java的类有类变量也有实例变量,因此翻阅了相关资料,发现python也有类似的类变量和实例变量,下面来看看详细的介绍。看下面的示例代码:class A: x = 0 def __init__(self): self.y = 0x就是类变...转载 2018-02-25 13:23:46 · 2423 阅读 · 2 评论 -
Python __dict__与dir()区别
Python下一切皆对象,每个对象都有多个属性(attribute),Python对属性有一套统一的管理方案。__dict__与dir()的区别:dir()是一个函数,返回的是list;__dict__是一个字典,键为属性名,值为属性值;dir()用来寻找一个对象的所有属性,包括__dict__中的属性,__dict__是dir()的子集; 并不是所有对象都拥有__dic转载 2018-01-26 20:11:13 · 411 阅读 · 0 评论 -
Python-装饰器
增加计时检测性能;给函数增加事务能力,在不改动原函数的情况下,增加该函数额外的功能语法装饰器就是把其他函数作为参数的函数;装饰器以@开头,紧接着是装饰器的名字,然后是是被修饰的函数和装饰函数的可选参数,格式如下 @decorator def fun(fun_arg): ….类中的静态方法和类方法就是典型的装饰器的应用。多个装饰器 @dec2转载 2018-01-26 20:46:39 · 279 阅读 · 0 评论 -
Python爬虫利器三之Xpath语法与lxml库的用法
前言前面我们介绍了 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法。如果大家对 BeautifulSoup 使用不太习惯的话,可以尝试下 Xpath。参考来源lxml用法源自 lxml python 官方文档,更多内容请直接参阅官方文档,本文对其进行翻译与整理。l...转载 2018-02-26 19:43:06 · 758 阅读 · 0 评论 -
XPath在python中的高级应用
XPath在python的爬虫学习中,起着举足轻重的地位,对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但XPath明显比re具有优势,在网页分析上使re退居二线。XPath介绍:是什么? 全称为XML Path Language 一种小型的查询语言 说道XPath是门语言,不得不说它所具备的优点: 1) 可在XML中查找信息 2) 支持HTML的查找 3...转载 2018-02-26 20:03:54 · 1048 阅读 · 0 评论 -
Windows下安装Scrapy的方式和问题总结
传统方式安装Scrapy(慎用)练习了基本的操作之后,当然就要找框架来进行爬虫实验啊。于是就在网上找Windows 64安装Scrapy的方法,查到的都是非常繁琐的安装方式,由于Scrapy有很多个依赖,所以在安装Scrapy之前你就要先安装他的所有的依赖啊,下面列举出部分依赖库:lxml模块 cryptography模块 pywin32模块 Twisted模块 pyOpenSSL模块等等...转载 2018-02-27 15:49:22 · 4299 阅读 · 0 评论 -
如何将python3.6软件的py文件打包成exe程序
在我们完成一个Python项目或一个程序时,希望将Python的py文件打包成在Windows系统下直接可以运行的exe程序。在浏览网上的资料来看,有利用pyinstaller和cx_Freeze进行打包的方法。关于cx_Freeze打包的方法,可以参考wangdamozhizhou博客windows下cx_Freeze生成Python可执行程序中的方法。由于方法主要是可以用于Python3.3版...转载 2018-02-28 17:06:08 · 1487 阅读 · 0 评论 -
Inno Setup Compiler封装成windows安装文件
安装后打开Inno setup选择【Creat a new script file using the Script Wizard】点击【Next】填写制作后程序的基本信息;设置应用程序文件夹信息,建议保持默认浏览选择主exe执行文件;添加程序附属的其它文件(主exe程序调用的其它文件);设置其它信息或保持默认;设置应用程序安装时的许可信息、提示...转载 2018-02-28 19:44:16 · 664 阅读 · 0 评论 -
Python 标准数据类型:Bytes
Bytes 对象是由单个字节作为基本元素(8位,取值范围 0-255)组成的序列,为不可变对象。Bytes 对象只负责以二进制字节序列的形式记录所需记录的对象,至于该对象到底表示什么(比如到底是什么字符)则由相应的编码格式解码所决定。我们可以通过调用 bytes() 类(没错,它是类,不是函数)生成 bytes 实例,其值形式为 b’xxxxx’,其中 ‘xxxxx’ 为一至多个转义的十六进制...原创 2018-02-23 23:21:02 · 981 阅读 · 0 评论 -
python中的urlencode与urldecode
当url地址含有中文,或者参数有中文的时候,这个算是很正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至’/’做一下编码转换。一、urlencodeurllib库里面有个urlencode函数,可以把key-value这样的键值对转换成我们想要的格式,返回的是a=1&b=2这样的字符串,比如:>>> from urll...转载 2018-02-24 14:45:20 · 434 阅读 · 0 评论 -
python requests用法总结
requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。可以说,Requests 完全满足如今网络的需求 本文全部来源于官方文档 http://docs.python-requests.org/en/master/ 安装方式一般采用$ pip install requests。其它安装方式参考官方文档HTTP - requestsim...转载 2018-02-24 16:06:48 · 828 阅读 · 0 评论 -
Python代理使用
“合群才是你堕落的开始” “堕落得心安理得”一些网站会有相应的反爬虫措施,例如很多网站会检测某一段时间某个IP的访问次数,如果访问频率太快以至于看起来不像正常访客,它可能就会会禁止这个IP的访问。所以我们需要设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,依然可以换个IP继续爬取。在Python中,可以使用urllib2中的ProxyHandler来设置使用代理服务器,...转载 2018-02-24 15:47:25 · 5795 阅读 · 0 评论 -
Python3 中代理使用方法总结
获取代理在做测试之前,我们需要先获取一个可用代理,搜索引擎搜索“代理”关键字,就可以看到有许多代理服务网站,在网站上会有很多免费代理,比如西刺://www.xicidaili.com/,这里列出了很多免费代理,但是这些免费代理大多数情况下都是不好用的,所以比较靠谱的方法是购买付费代理,很多网站都有售卖,数量不用多,买一个稳定可用的即可,可以自行选购。或者如果我们本机有相关代理软件的话,软件...转载 2018-02-24 20:12:18 · 754 阅读 · 0 评论