![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
罗小黑的黑
这个作者很懒,什么都没留下…
展开
-
你还为没有数据测试而发愁吗?介绍一个专业Fake的python库,什么个人信息、IP、UserAgent统统搞定
小编经常需要批量测试一些数据,有时候测试环境又暂时没数据,特意找了一下,发现有一个可批量生成数据的python库----faker,现在就介绍一下它的使用方法,如果你不想一行一行输入代码,那小编页提供了完整测试代码从今天开始种树。安装pip install faker使用简单使用本库可生成姓名、地址、电话、邮箱、公司等等一系列数据。首先导入库,实例化:from faker import Fakerfake = Faker()先看看正面生成一个人的姓名地址吧: for _ in.原创 2020-09-01 20:26:54 · 597 阅读 · 0 评论 -
爬虫必看,每日JS逆向之爱奇艺密码加密,今天你练了吗?
本次目标是抠出爱奇艺passwd加密JS代码,如果你看到了这一篇,说明你对JS逆向感兴趣,如果是初学者,那不妨再看看我之前的一些文章,可能对你的学习路有些帮助,跟着一起调试,对JS加密方法理解会更深点。如果调试不出来,可以参考我的代码,本期JS代码放在从今天开始种树准备本期抠爱奇艺passwd加密JS代码,传送门,登录界面如下(我已经尝试了一次):老老方法(输入错误账号密码)找到提交url和提交的参数(即FormData里的值):FormData提交的参数:可以看到passwd已经被某种.原创 2020-08-27 21:19:31 · 463 阅读 · 0 评论 -
怎么用python检测图片中是否包含二维码?
前言因为一直在几个平台发文章,发现有些平台并不会检测文章中的图片是否会包含二维码,但是其中也有平台会去检测,所以就去研究了一下python如何去检测。搜了一下大概有两个库可以使用:一个是zbar,这个库是挺牛的,不过只支持python2.7,再者也没有继续维护,什么年代了,应该没人使用python2.7了吧(2020年1月以后连python2.7都不再维护了,有还在使用的童靴该跟上时代了)。一个是pyzbar,基本上传承了zbar的功能。安装顺便把Pillow库也安装了,安装时候最好加上豆瓣源原创 2020-08-25 21:51:11 · 1715 阅读 · 0 评论 -
兄弟们,我打算抠100个网站JS加密代码召唤,一个也跑不掉,这次轮到小虎牙
本次研究虎牙登录密码加密JS代码,难度不大,依然建议各位读者参考文章独自完成,实在抠不出来再参考这里的完整代码:从今天开始种树准备打开网站虎牙,点击登录标签,跳到登录界面:按下F12,输入错误的账号密码,查看发送的网络请求,从名字就能确定是哪个请求,看下图:看一下都提交了哪些参数,查看Formdata,可以看粗来password已经被加密了:好了,那就通过调用栈进去直接查找password关键字,查看调用栈:依然通过名字来判断点到哪个js文件。进去以后查找password,我找的适合p.原创 2020-08-23 22:02:17 · 325 阅读 · 0 评论 -
这个爬虫JS逆向加密任务,你还不来试试?逆向入门级,适合一定爬虫基础的人
这次选择苏宁易购登录密码加密,如能调试出来代表你具备了一定的JS逆向能力,初学者建议跟着内容调试一波,尽量独自将JS代码抠出来,实在抠不出来参考这里从今天开始种树。传送门前言最近都在研究一些网站的登录密码加密JS代码,都比较简单,非常适合有一定爬虫基础准备进阶的童靴,只有这些做好了下一步才能开始着手滑块验证码这个大坑,废话不多说,直接开整。准备打开苏宁易购登录网址点这里:是不是一阵熟悉的赶脚。老规矩,输入错误的账号密码点击登录,看看提交链接:可以看出登录账号密码被提交到了https:/.原创 2020-08-21 20:33:56 · 215 阅读 · 0 评论 -
“赶快上车,会调用你也可以当鉴黄师了”说罢,老司机转眼间将车门焊得死死的!
起因本人在某平台发布文章时封面用了几张美女图片,内容里都是正常的流程图之类的,却被这个平台告知如下内容,大家评评理这图片违规么:屡次申诉无果,想想这么大的平台不应该全靠手工审核吧,每天几十万上百万稿件那不得累死人,遂着实想看看是不是有这样的接口供调用,一百度果然有,这里分享一下。准备创建应用本次使用的百度开放平台的图文审核功能传送门,去控制台新建一个内容审核应用:标星号的填完即可保存。下载SDK如下图点击左侧SDK下载,右边是你刚刚新建的应用信息,AppID、APIKey、Secret原创 2020-08-22 20:17:10 · 492 阅读 · 0 评论 -
兄弟,你爬虫基础这么好,需要研究js逆向了,一起吧(有完整JS代码)
这几天的确有空了,看更新多快,专门研究了一下几个网站登录中密码加密方法,比起滑块验证码来说都相对简单,适合新手js逆向入门,大家可以自己试一下,试不出来了再参考我的js代码。篇幅有限,完整的js代码在这里:从今天开始种树前戏今天要碰的是汽车之家,关于这个网站网上大多都再研究其字体反爬,如果想研究字体反爬的话直接搜一下就有很多。今天主要是研究汽车之家在登录时的password加密方法,并通过python调用js的方式运行出加密结果。开始老规矩,打开登录页面,长下面这样,与大多网站一样的布局,切.原创 2020-08-16 21:11:42 · 532 阅读 · 2 评论 -
兄弟,别再爬妹子图了整点JS逆向吧--陆金所密码加密破解
好久没有写爬虫文章了,今晚上得空看了一下陆金所登录密码加密,这个网站js加密代码不难,适合练手,不废话,直接开整。前戏热身打开陆金所网站,点击到登陆界面,长这样:按F12打开工具,再登录随便输入一个号码和密码,点击登录按钮,查看发送的请求:一共有3个,从请求名称上也看的出来哪个是登录请求(看不出来的话一个一个点击),拉下来,看看提交的FormData:我输的密码是123,可以看出来这里把password加密了,既然加密了那我们就去js文件里找找加密方法呗。激战开始切换到Sources.原创 2020-08-15 14:31:59 · 661 阅读 · 1 评论 -
python面试48题(附答案):语言特性与数据类型篇
本文内容均收集自互联网,并对内容不恰当地方进行适当修改。更多请访问从今天开始种树正文1. 谈谈对 Python 和其他语言的区别答:Python 是一门语法简洁优美,功能强大无比,应用领域非常广泛,具有强大完备的第三方库,它是一门强类型的可移植、可扩展,可嵌入的解释型编程语言,属于动态语言。拿 C 语言和 Python 比: Python 的第三方类库比较齐全并且使用简洁,很少代码就能实现一些功能,如果用 C 去实现相同的功能可能就比较复杂。但是对于速度来说 Python 的运行速度相较于 C 就.原创 2020-07-16 22:03:57 · 1468 阅读 · 0 评论 -
爬虫学习(5):豆瓣、Steam账号PC端登录(登录篇一)
登录后才能获取数据也是现在反爬的一个重点,所以计划接下来的几期内容都是关于登录各大站点。由于js代码过长,所以只截取了部分,完整代码移步从今天开始种树,直接拷贝运行即可。啰嗦两句各大网站登录提交数据的方式不太 一样,有些只需要POST明文的账号密码、有些网站POST的密码是经过加密的(RSA、BASE64、AES、SHA1等等),还有些网站增加了一些其它的参数,而这些网站的统一特点就是均可以从JS文件中提取加密代码复现出来,获得这些代码则完全依靠数据提取师父们个人的调试能力了,下面就尝试去登录两个不.原创 2020-07-08 10:55:04 · 895 阅读 · 1 评论 -
爬虫学习(4):自动保存百度云盘资源
完整代码移步从今天开始种树开始在上一文中,我们保存了百度云盘的地址和提取码,但是这种分享链接很容易被屏蔽,最好的做法就是保存资源到自己的网盘,不过采集的链接有上万个,人肉保存并不现实,所以本文尝试了批量保存资源,如您还没看过上文,这里可以跳转。爬虫学习3:搭建自己的电影资源网保姆式教学观察请求以下面资源链接为例:https://pan.baidu.com/s/1tHSxZQueF-Wsa2T0NlT3vQ在浏览器中输入以上链接,会自动跳转到https://pan.baidu.com/sh.原创 2020-06-28 19:59:07 · 2520 阅读 · 0 评论 -
爬虫学习(3):搭建自己的电影资源网(保姆式教学)
本文所涉及的资源均采集自互联网,如有侵权,即刻删除。背景随着版权意识的增强,以前在网上“广为流传”的资源版权均已被几大视频网站购买,有些时候不得不去开所有网站的会员才得以一睹芳容,甚至有些冷门和年代较老的电影还没有。想看还得靠双手来采集,由于某些原因,本文中不会出现这些网站的网址,如想了解,请移步从今天开始种树。思路与流程总体流程与涉及技术如上所示,选定的几个网站采集都很简单,属于baby级,主要还是找到这些网站。选定目标经过四处搜索,发现有几个网站资源均已某度网盘形式保存,固选定了这几家.原创 2020-06-26 10:17:12 · 2917 阅读 · 0 评论 -
爬虫学习(2):贴吧之骑马与砍杀2,愿它长寿?
前言爷爷,你的骑砍2发售了!!!骑马与砍杀2:霸主 抢先体验版于2020年3月31日发售,到今天砍友们已经畅砍了一周,从中文站快速更新版本的消息来看,目前体验版还存在很多bug,希望经过这段时间的完善能让正式版更加具有可玩性。当然,今天不是来做游戏试玩,我们还是希望能通过爬取骑砍吧的一些评论看看发售前和发售后大众的态度,不废话了,开始。准备工作工具mongdbxpath库reques...原创 2020-04-07 20:09:43 · 550 阅读 · 0 评论 -
Centos下python3和virtualenv的安装
前言最近买了个云服务器,Linux自带python2.7,都快出python4了,这至少怎么说也得换个python3.6以上的玩玩啊,刚好记录一下安装过程,顺便安装了极其好用的virtualenv,希望对正在安装的人也有帮助。安装步骤python31.备份python2cd /usr/bin/mv python python.bak2.更改yum配置把/usr/bin/yum和...原创 2020-03-30 23:26:29 · 245 阅读 · 0 评论 -
爬虫入门------从数据看奥斯卡陪跑健将到底是谁?学院派评委都热衷于哪类电影?
前言奥斯卡颁奖季虽已过去有些日子,《寄生虫》夺得最佳影片,不过《1917》也不拉下风,全片的长镜头的确震撼,不过这不是今天要蹭的过气热点。作为一个电影死忠,当然还是想通过数据看看谁是奥斯卡男主最优陪跑员,谁又是白给先锋,奥斯卡派评委都热衷于哪类电影,以前总是听说小李子一直在陪跑(不过他在16年就凭借《荒野猎人》中的出色表现夺得最佳男主,还记得大众网友烧香拜佛来保佑他夺冠),今天就通过爬取一些历年...原创 2020-03-29 20:04:55 · 1001 阅读 · 0 评论 -
深入浅出图神经网络:GNN原理解析(一)
前言 最近在学习图神经网络相关知识,一起来拆书:《深入浅出图神经网络:GNN原理解析》,这本书从原理、算法、实现、应用四个维度详细讲解了图神经网络。接下来打算结合书本内容和相关知识做个专题记录分享,今天先跟大家聊聊关于图的一些基础知识。为什么要研究图? 很多数据都是图结构,例如社交网络、经济网络、生物医学网络、信息网络(互联网网站、学术引用)、互联网、神经网络。而网络是它们的通用语言,...原创 2020-03-29 17:39:19 · 15616 阅读 · 11 评论 -
Celery的使用(1)---简单配置与初次运行
前言celery是一个基于python开发的简单、灵活且可靠的分布式任务队列框架, 是一个分布式队列的管理工具, 可以用 Celery 提供的接口快速实现并管理一个分布式的任务队列.。它采用了典型的生产者-消费者模型,主要由三部分组成:消息队列broker:broker实际上就是一个MQ队列服务,可以使用Redis、RabbitMQ等作为broker;处理任务的消费者workers:...原创 2020-03-10 21:54:35 · 228 阅读 · 0 评论 -
Django使用redis进行缓存
对于非经常更新的服务器数据,若每次都从硬盘读取一次,会浪费服务器资源、拖慢响应速度,而且数据更新频率较高,服务器负担比较大。若保存到数据库,还需要额外建立一张对应的表存储数据。一个更好的方法是在Django中使用Redis进行缓存。缓存配置首先安装django-redis:pip install django-redis在setting文件中设置CACHES:CACHES = { ...原创 2020-03-09 22:00:54 · 617 阅读 · 0 评论 -
python源码中的pass
这段时间在研究一些标准库代码,发现很多实现都是下面这样:@classmethoddef find_spec(cls, *args, **kwargs): # real signature unknown pass@classmethoddef get_code(cls, *args, **kwargs): # real signature unknown """ Re...原创 2019-02-01 15:58:36 · 1654 阅读 · 0 评论