python
锦楠
这个作者很懒,什么都没留下…
展开
-
ida修复函数名
ida修复函数名。原创 2022-09-21 10:57:33 · 666 阅读 · 0 评论 -
Python 创建16进制文件
将已有16进制数据写成16进制文件。原创 2022-09-19 10:42:42 · 1183 阅读 · 0 评论 -
Frida js端send数据到Python中文乱码解析
Frida send 函数中已经支持了二进制数据的传输。只是它的二进制数据是 ArrayBuffer 类型,所以在传输之前需要注意将二进制数据转换为 ArrayBuffer,解决方式如下:原创 2022-07-06 15:52:25 · 2060 阅读 · 1 评论 -
Python实现按指定长度分段切割字符串
mes = ['9F', 'C6', 'DB', '00', '9F', 'C6', 'DA', 'F0', '9F', 'C6', 'DA', 'E0', '9F', 'C6', 'DA', 'D0', '9F', 'C6', 'DA', 'C0', '9F', 'C6', 'DA', 'B0', '9F', 'C6', 'DA', 'A0', '9F', 'C6', 'DA', '90', '9F', 'C6', 'DA', '80', '9F', 'C6', 'DA', .原创 2022-05-10 09:32:05 · 3407 阅读 · 0 评论 -
dmzj 内容抓取
from urllib.request import urlretrieveimport requestsimport reimport execjsfrom bs4 import BeautifulSoupclass Anime(object): def __init__(self): self.headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7).原创 2022-05-09 23:57:07 · 135 阅读 · 0 评论 -
pip 安装第三方模块报错
1、第一种情况可能需要我们升级一下pip版本,于是执行命令python -m pip install --upgrade pip大部分情况下,还是一样的报错!2、第二种情况在第一种情况失败后,考虑更换 pip 源pip install pymysql -i https://pypi.tuna.tsinghua.edu.cn/simple/大部分情况下可以成功,已然会有失败的可能!3、第三种情况(杀手锏)这时考虑是网速的原因,这时采用国内的镜像源来加速原创 2022-04-20 17:11:00 · 1868 阅读 · 0 评论 -
如何去除文本中的结束符 “\00“
最近在做文件处理时,遇到一个问题,那就是文件第一行或几行后跟了结束符 "\00",导致在读取文件时无法一次性全部读取,数据会被截断,思考了半天,用python写脚本处理了这个问题。主要代码如下:by = bytes(message, 'UTF-8') # 先将输入的字符串转化成字节码hex_list = ("{:02X}".format(int(c)) for c in by) # 将文本信息转16进制 buflist = list(hex_list) # 列表储存16进制信息w..原创 2021-09-09 11:48:46 · 1554 阅读 · 0 评论 -
Python urllib 常用函数解析
一、urlopen函数作用:创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。url:请求的url;data:请求的data,如果设置了这个值,那么将变成post请求;返回值:返回值是一个http.client.HTTPResponse对象,这个对象是一个类文件句柄对象;有read(size)、readline、readlines以及getcode等方法。二、urlretrieve函数作用:可以方便的将网页上的一个文件保存到本地。re...原创 2021-07-01 15:44:53 · 507 阅读 · 0 评论 -
Python 指定信息在批量文件中搜索
Python 在众多文件中搜索想要的内容有时候在几千个文件中,查找某个信息,还不知道这个信息在哪个文件中,这可太折磨了。于是乎就写了以下代码,能够实现在指定目录下搜索所有文件查找出具有想要搜索信息的文件。代码如下:import osimport datetimeclass search_mes(): def __init__(self): self.file_list = [] self.s_mes = '***' # 你要搜索的信息原创 2021-06-24 15:20:25 · 805 阅读 · 0 评论 -
2021年6月知乎指定问题信息爬取 & x-zse-96 2.0版本加密破解分析 爬虫破解反扒思路
一、前言本文仅供研究与学习使用知乎现今的 x-zse 参数的加密方法已升级成了:x-zse-96 2.0版本。来看这篇帖子的应该都知道,这个参数动态唯一,没有就拿不到api数据。查阅了网上有关文章,仅有x-zse-86 2.0版本的解密方法,现今已不适用,加上之前写的文章中有提及该解密方法,所以出一篇帖子,供大家研究与学习。二、破解思路打开浏览器,进入知乎,任意搜索一问题后,打开开发者模式,查看网页 js 文件。步骤如下:进入开发者模式后点击 Sources 源文件;在源文件左侧选中原创 2021-06-24 14:53:40 · 6462 阅读 · 26 评论 -
Python爬取知乎指定问题
Python爬取知乎指定问题回答记得上周写了个帖子,里面有想对知乎指定问题进行爬取,但知乎的反爬措施还是做得比较好的,想通过正常网页解析的手段去拿到数据是实现不了了,因为人家压根就不给你数据,最后呢也是通过解析api端口,实现了问题的该功能。具体实现如下:headers = { 'x-app-za': 'OS=Web', 'x-zse-93': '101_3_2.0', 'x-zse-96': '2.0_a7Y0o6Lq6T2Xnu281RF8Uvr0N原创 2021-06-22 14:04:51 · 921 阅读 · 0 评论 -
抖音美女千千万,想用Python爬爬看
抖音美女千千万,想用Python爬爬看目 标 场 景相信大家平时刷抖音短视频的时候,看到颜值高的小姐姐,都有随手点赞关注的习惯。如果一条条去刷确实很耗时间,如果 Python 能帮忙筛选出颜值高的小姐姐那就省了很多事。本篇文章是借助「百度人脸识别」API,帮我们识别出抖音上颜值高的小姐姐,然后下载到手机相册中。准 备 工 作首先,项目需要对页面元素进行一些精准的操作,需要提前准备一部 Android 设备,激活开发者选项,并在开发者选项中打开 「USB 调试和指针位置」两处设置。为了确保 ad转载 2021-06-21 16:59:20 · 529 阅读 · 0 评论 -
Python 通过知乎热榜api端口抓取数据
Python 通过知乎热榜api端口爬取数据前几天写了份知乎网页版爬取热榜信息的帖子,思来想去,过于繁琐,于是采用抓取知乎热榜api端口的方式进行解析,果不其然,心情舒畅了。代码如下,至于如何抓取api端口,各位大佬可自行百度,也是比较简单。import requestsimport json# 请求头构建headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,原创 2021-06-21 15:04:10 · 1388 阅读 · 0 评论 -
Python实现知乎热点信息爬取
小白也能懂因知乎进主页必须登录后才能够访问信息,且登录界面的验证方式破解难度是较高,经过一番分析,最终选择了使用selenium模拟登录,然后获取cookie的方式。在实现主页信息爬取及热点信息爬取都无问题。在指定问题进行搜索时,返回无内容,应该是知乎的反爬措施变态,查阅了许多博主及各种帖子,都没有较好的解决方法,各位大佬如果有的话,还望对我指指点点一下。该函数也一并放进帖子中,尝试了许多种办法,写得也比较乱,将就着看看吧。上代码,不懂私信可回。1、第三方库import jsonimpor原创 2021-06-18 16:37:06 · 1549 阅读 · 0 评论 -
安居客房源信息爬取
工作之余所写 现今能用小白专属,私信可回。import requestsfrom bs4 import BeautifulSoupfrom loguru import loggerimport time# 构建请求头headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82原创 2021-06-17 17:48:38 · 478 阅读 · 0 评论 -
Python 全局解释器锁 (GIL)
在 Python 的原始解释器 CPython 中存在着 GIL(Global Interpreter Lock,全局解释器锁),因此在解释执行 Python 代码时,会产生互斥锁来限制线程对共享资源的访问,直到解释器遇到 I/O 操作或者操作次数达到一定数目时才会释放 GIL。由于全局解释器锁的存在,在进行多线程操作的时候,不能调用多个 CPU 内核,只能利用一个内核,所以在进行 CPU 密集型操作的时候,不推荐使用多线程,更加倾向于多进程。那么多线程适合什么样的应用场景呢?对于 IO 密集型操作,多原创 2021-06-01 15:18:37 · 127 阅读 · 0 评论 -
Python 特殊字符处理
Python 特殊字符处理特殊字符处理方法十六进制转为十进制过程中会可能存在无法转化的十六进制信息,如 \x00,等。尝试过诸多方式,以下代码处理为佳。mes_list = [] # 定义空列表,接收信息isvisible = 0 # 判断标志symbols = "'~!@#$%^&*()_+-*/<>,.[]\/\r\n" # 对特殊符号做处理for ch in data_mes[0:1]: # data_mes 为str信息 if u'\u4e00' <原创 2021-05-31 09:23:49 · 1161 阅读 · 0 评论 -
Python十六进制文件读取
Python进行十六进制文件读取转化及特殊字符处理 工作中所遇,简单做个小结,废话不多说,上码打开文件f = open(path,"rb") # 打开要读取的十六进制文件hex_list = ("{:02X}".format(int(c)) for c in f.read()) # 定义变量接受文件内容f.close() # 关闭文件 好习惯!buflist = list(hex_list) # 用列表保存信息,方便后续操作index_num = '{:d}'.form原创 2021-05-28 16:00:27 · 13104 阅读 · 3 评论