自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 2021-02-28

中医智库接口:https://www.zk120.com/ji/read/529?nav=ys&uid=None代码 # # import requestssource = requests.get(‘https://www.zk120.com/ji/content/529?uid=None&_=1614130155981’).json()print(source)#coding:utf-8import requestsfrom lxml.html import etree

2021-02-28 21:14:56 426

原创 2021-02-27

python操作贝塞尔曲线时间/移动次数xs = [0.0, 1.0, 2.0, 3.0, 4.0, 5.0]0.4-0.7 0.8-0.9ys = [0, 0, distance * get_random_range(0.4, 0.8), distance, distance, distance]贝塞尔曲线的基础线plt.figure()plt.plot(xs, ys, ‘b’) # 原曲线在10-15步之间滑动完毕num = random.randint(10, 15)调用公式

2021-02-27 20:11:05 410

原创 2021-02-25

Mac通过pycharm操作Tesseract- OCR进行图文识别1.打开pycharm的Terminal工具tesseract 文件名 out2.输入ls 查看文件会出现:out.txt3.识别文件cat out.txt

2021-02-25 23:51:47 145

原创 MacOS安装使用Tesseract-OCR进行图文识别

Mac安装Tesseract遇见的问题环境:Macos Big Sur1.打开terminal终端工具/bin/zsh -c “$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)”2.brew安装成功后, 注意brew安装过程中时间较长,请耐心等待brew install tesseract欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何

2021-02-25 23:38:19 648 1

原创 Python的NumPy库中dot()函数详解

Python的NumPy库中dot()函数详解1、NumPy库中dot()函数语法定义:import numpy as npnp.dot(a, b, out=None) #该函数的作用是获取两个元素a,b的乘积.2、前面讲过数组的运算是元素级的,数组相乘的结果是各对应元素的积组成的数组,而对于矩阵而言,需要求的是点积,这里NumPy库提供了用于矩阵乘法的dot函数。在jupyter notebook中执行的代码运算如下:dot函数的运算总代码显示如下3、这样的多维数组矩阵运算,..

2020-07-29 17:40:39 36171 3

转载 总结一些网站加密和混淆技术

我们在爬取网站的时候,经常会遇到各种各样类似加密的情形,比如说: 某个网站的 URL 带有一些看不太懂的长串加密参数,要抓取就必须要懂得这些参数是怎么构造的,否则我们连完整的 URL 都构造不出来,更不用说爬取了。 分析某个网站的 Ajax 接口的时候,可以看到接口的一些参数也是加密的,或者 Request Headers 里面也可能带有一些加密参数,如果不知道这些参数的具体构造逻辑就没法直接用程序来模拟这些 Ajax 请求。 翻看网站的 JavaScript 源代码,可以发现很多

2020-07-29 17:29:31 1302

原创 App抓包

Python爬虫:Fiddler抓取抖音视屏数据准备工作:(1)、安卓模拟器(2)、抓包工具:Fiddler(3)、编程工具:pycharm(4)、安卓模拟器上安装抖音(5)、本地创建保存json文件及下载视频文件夹(例G:\software\fid和G:\software\video)fidder配置在Tools中的options中,按下图勾选fidder配置1.jpg配置远程连接:选择允许监控远程连接,端口可以任意设置,默认8888fedder配置..

2020-07-29 17:25:18 2060

原创 Python操作MongoDB

MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容存储形式类似JSON对象,它的字段值可以包含其他文档、数组及文档数组,非常灵活。在这一节中,我们就来看看Python 3下MongoDB的存储操作。1. 准备工作在开始之前,请确保已经安装好了MongoDB并启动了其服务,并且安装好了Python的PyMongo库。2. 连接MongoDB连接MongoDB时,我们需要使用PyMongo库里面的MongoClient。一般来说,传入MongoDB

2020-07-29 17:22:46 184

原创 python 破解字体加密实战

破解字体加密,以58同城网站为例。字体加密是爬取网页的过程中比较麻烦的问题。字体加密一般是网页修改了默认的字符编码集,在网页上加载的他们自己定义的字体文件作为字体的样式,可以正确地显示数字,但是在源码上同样的二进制数由于未加载自定义的字体文件就由计算机默认编码成了乱码。网站url : https://sh.58.com/chuzu/0/?PGTID=0d200001-0000-2b84-5b0c-434a2838407f&ClickID=1一般来说,通用的解决办法是找到字...

2020-07-29 17:17:44 1074

转载 Python 的AES加密与解密

AES加密方式有五种:ECB, CBC, CTR, CFB, OFB从安全性角度推荐CBC加密方法,本文介绍了CBC,ECB两种加密方法的python实现python 在Windows下使用AES时要安装的是pycryptodome 模块 pip install pycryptodomepython 在Linux下使用AES时要安装的是pycrypto模块pip install pycryptoCBC加密需要一个十六位的key(密钥)和一个十六位iv(偏移量)ECB加密...

2020-07-29 17:12:45 738

原创 Python关于AES的探索

Python关于AES的探索,目前涉及2个包(pyaes和Crypto)和两种模式(CBC和CFB)首先说下AES里Cryto这个包在CBC下的使用:import sysfrom Crypto.Cipher import AESfrom binascii import b2a_hex, a2b_heximport pyaesclass prpcrypt(): def __init__(self, key): self.key = key sel

2020-07-29 17:09:41 231

转载 python反爬之破解动态页面(三)

前言  在前边两节我们分析了两个动态页面,过程还算简单。今天,我们来看一个复杂的例子。本来博主自己找到了一个例子准备分析的。不过,在分析时偶然搜到一篇分析动态页面的文章,过程详细清晰,且过程一波三折。博主抱着学习与分享的心态转载再创造这片文章,不过经过博主自己的实践,整个过程有一些小问题,在后边也会指出,原文参考自崔老师崔庆才的博客。正文疑难杂症  中国空气质量在线监测分析平台是一个收录全国各大城市天气数据的网站,包括温度、湿度、PM 2.5、AQI 等数据,链接为:https://www.

2020-07-29 17:04:01 405

转载 谷歌浏览器进行JS断点调试

打开谷歌浏览器,点击F12,打开开发者工具Sources中存放着:html、css、js、jspElements中可以查看页面的dom结构1.debugger的使用(添加断点的方式一)在需要调试的js代码中,添加“debugger”,末尾不需要添加分号当运行到这行js时,如果谷歌浏览器的开发者调试模式已开启,则会自动进入到js调试模式,js代码的执行将停留在这一行。如下图为js调试的工具条如果需要查看一下js中某个变量的值,则可以将鼠标移动到js中的这个变量上,就会自

2020-07-29 16:26:01 3522 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除