自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(88)
  • 收藏
  • 关注

原创 sns.regplot 和 sns.distplot你知道多少

sns.regplot和sns.distplot这两个图形的使用场景记录。sns.regplot 用来比较两个变量的关系,是否符合线性回归。一般用来比较特征变量和标签变量上。sns.distplot 是直方图和核密度图(sns.kdeplot)的结合。用来看单个连续型变量的分布。顺便说下直方图和条形图区别:直方图:先分箱,然后计算每个分箱频数的数据分布。直方图一般用于数字特征(连续型);条形图一般用于类别特征,条形图有间距,直方图没有。先用小费数据集画出图形。# 导入包import se

2020-11-12 13:57:45 11445 1

原创 阿里测试题之join在数据库中的区别

背景QL中JOIN子句是用于把来自两个或多个表的数据连接起来,在这个过程中可能会添加一些过滤条件。昨天有小伙伴问,如下图的这两种SQL写法查询结果是否会一样?(好像这是某一年阿里的面试题)这个问题提出来以后,多数小伙伴的回答是:查询结果应该是一样的吧,只是查询效率不一样。我当时的回答是,在Inner Join时这两种情况返回的结果是一样的,在Left、Right等情况时结果不一样。案例1、创建测试数据库和表并且插入用户测试的数据。-- 创建数据库CREATE DATABASE ods_stud

2020-11-12 13:51:33 479

原创 pip安装详解

pip是python的包管理工具,python2.7/python3.4以上的版本都已经集成了该工具,我们可以用pip --version命令确认是否安装。如果未安装pip的,请往下看。下载进入https://pypi.org/project/pip/选择红框中的文件下载图windows下安装下载完成后解压得到我们用CMD进入该目录下,输入python setup.py install命令进行安装码字不易废话两句:有需要python学习资料的或者有技术问题交流 “点击”即可如果是第

2020-11-12 13:43:06 81068 8

原创 又是一个超好用的python可视化工具

实时堆栈追踪(stacktrace)Heartate——如监测心率般追踪程序运行项目地址:https://github.com/alexmojaki/heartrate(点击阅读原文即可访问)Heartrate 是一个 Python 的工具库,可以实时可视化 Python 程序的执行过程。监控运行中的 Python 程序如图:如图所示,左侧数字表示每行代码被触发的次数。长方框表示最近被触发的代码行——方框越长表示触发次数越多,颜色越浅表示最近被触发次数越多。该工具可以做什么:启动程序追踪.

2020-11-11 15:30:31 415

原创 这篇文章能让你吃透SVG

VG转换在SVG图像中创建的形状。例如,移动,缩放和旋转形状。这是显示垂直或对角线文本的便捷方法。一、转换简单示例例:<svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"> <rect x="50" y="50" height="110" width="110" style="stroke:#ff0000; fill: #ccccff" tr

2020-11-11 15:23:36 467

原创 详解fs命令

导读在我们进行数据整理的过程中,我们经常会用到循环来写程序,那如果想对某一路径下的文件或文件夹进行循环,应该怎么操作呢?我们可以用宏扩展函数或者fs命令将文件或文件夹的名称放入局部宏或返回值中,再结合循环进行操作。那么今天我们就来简单介绍一下fs命令的用法~简单介绍一下fs命令的用法~fs命令可以在Stata结果输出窗口输出当前文件夹下或当前目录下的文件名称(不包括文件夹和目录),也可以列示指定路径或当前路径下指定类型的文件,并将结果储存在返回值r(files)中。例如,当我们更改到确定的路径之后,如

2020-11-11 15:15:06 5437

原创 你对stata中的recode了解多少

导读初识recode命令,我以为它就是个改缺失值的小能手。我们常常看见它是这样出现的:recode a (.=0)它的作用等效如下:replace a=0 if a=.再识recode,才发现这个小命令没那么简单!掌握了recode,处理起数值型变量不是一般地溜!好东西就要分享,接下来,我就给大家全面解析recode命令。码字不易废话两句:有需要python学习资料的或者有技术问题交流 “点击”即可一、语法recode命令的完整语法如下:code varlist (erule) [(e

2020-11-11 15:05:28 11123

原创 不会吧,不会还有人解决不了数据倾斜吧

数据倾斜的表现表现体现在数据处理任务进度长时间维持在 99%(或100%),查看任务监控页面,发现只有少量(1 个或几个)reduce 子任务未完成。因为其处理的数据量和其他 reduce 差异过大。单一 reduce 的记录数与平均记录数差异过大,通常可能达到 3 倍甚至更多,最长时长远大于平均时长。倾斜产生的原因及解决办法空值产生的数据倾斜果两个表连接时,使用的连接条件有很多空值,会造成有 null 关联的那个分区数据特别多,可以在连接条件中增加过滤,去除空值。select *from us

2020-11-10 15:12:08 258

原创 嵌套 JSON 之后居然变成了它?

调用API和文档数据库会返回嵌套的JSON对象,当我们使用Python尝试将嵌套结构中的键转换为列时,数据加载到pandas中往往会得到如下结果:df = pd.DataFrame.from_records(results [“ issues”],columns = [“ key”,“ fields”])说明:这里results是一个大的字典,issues是results其中的一个键,issues的值为一个嵌套JSON对象字典的列表,后面会看到JSON嵌套结构。问题在于API返回了嵌套的JSON结

2020-11-10 15:01:08 329

原创 代码写的太乱?一分钟教你优化

简介我们在利用pandas开展数据分析时,应尽量避免过于「碎片化」的组织代码,尤其是创建出过多不必要的「中间变量」,既浪费了「内存」,又带来了关于变量命名的麻烦,更不利于整体分析过程代码的可读性,因此以流水线方式组织代码非常有必要。下面要介绍的pipe(),我们就可以将任意pandas代码完美组织成流水线形式。在pandas中灵活利用pipe()pipe()顾名思义,就是专门用于对Series和DataFrame操作进行流水线(pipeline)改造的API,其作用是将嵌套的函数调用过程改造为「链式

2020-11-10 14:47:06 795

原创 学AI没用?现在AI都能写作文了

前段时间,浙江高考满分作文《生活在树上》因为晦涩难懂的内容,刷爆了各种社交媒体。外行人看热闹,内行人看门道,大神们透过现象看本质。一般来说,高考作文可以通过批量化、模式化的训练达到一个令人满意的分数。实际上就是把学生当做一个写作机器进行训练,为学生输入大量范文,提供写作模式,然后进行长时间的学习。等等,这不是和人工智能的训练过程相同吗?那么,如果给一个人工智能系统同样的数据,是否可以教会它写作文呢?答案是,当然可以。01 EssayKiller 的基本组成一个 AI 不管外形和功能如何,其核心都

2020-11-10 14:36:45 1418

原创 用python使图形动起来?

数据暴增的年代,数据科学家、分析师在被要求对数据有更深的理解与分析的同时,还需要将结果有效地传递给他人。如何让目标听众更直观地理解?当然是将数据可视化啊,而且最好是动态可视化。本文将以线型图、条形图和饼图为例,系统地讲解如何让你的数据图表动起来。这些动态图表是用什么做的?接触过数据可视化的同学应该对 Python 里的 Matplotlib 库并不陌生。它是一个基于 Python 的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——Fu

2020-11-09 14:01:51 2371

原创 用PyTorch构建神经网络,详细

在本文章中,我们将使用PyTorch从头开始实现一个简单的神经网络。注:阅读本文之前,最好可以了解神经网络的工作原理。虽然有很多库可以用于深度学习,但我最喜欢 PyTorch。作为一名python 程序员,我喜欢 PyTorch 的 python 行为是原因之一。它主要使用了python 的风格和能力,这是很容易理解和使用。在其核心,PyTorch提供两个主要特性:一个类似于numpy 的n 维张量,但可以在 gpu 上运行;自动区分建立和训练神经网络。什么是神经网络?神经网络是一

2020-11-09 13:55:06 9943 3

原创 这个库居然能让python提速100倍

python一直被病垢运行速度太慢,但是实际上python的执行效率并不慢,慢的是python用的解释器Cpython运行效率太差。“一行代码让python的运行速度提高100倍”这绝不是哗众取宠的论调。我们来看一下这个最简单的例子,从1一直累加到1亿。最原始的代码:import timedef foo(x,y): tt = time.time() s = 0 for i in range(x,y): s += i

2020-11-09 13:44:23 532 1

原创 不懂分布式锁的进来看看吧

简介我们常会遇到某段逻辑在相同时间段内只希望被单个实例执行,而在微服务架构中,一个程序可能会存在多个实例,此时就需要通过分布式锁来实现串行执行。最简单的分布式锁无非就是找到对于多个程序实例而言单一的存在,比如MySQL数据只有一个或Redis只有一个,此时都可以利用这单一的存在构建一个锁,多个程序实例要执行某段逻辑前必须先获得这个锁,然后才能执行。因为某些原因,上班的时候我和同事一起研究了一下Python redis库中分布式锁的实现源码,这里简单分享一下。通过pip可以安装这个库。pip ins

2020-11-09 13:34:34 185

原创 想知道北京的公交线路图吗?用python给你画出来

今天教大家用pyecharts制作北京市公交线路动态图,这应该是全网唯一一篇能正常运行的教程一、获取百度秘钥首先,本项目需要引用百度地图api,所以需要先注册获取百度开放平台秘钥,地址为:http://lbsyun.baidu.com/apiconsole/key#有账号的直接登录,没账号的先注册一下再登录,登录完成后,依次点击控制台-应用管理-我的应用-创建应用:访问应用(AK)下即是我们这次所需的秘钥二、整理公交车地理数据这个公交车地理数据着实有点坑,echarts官方给的数据长这样

2020-11-09 13:28:16 544

原创 学会了这几点,你就学会了Web | Django 与数据库交互

对开发人员来说,Django的ORM 确实非常实用,但是将数据库的访问抽象出来本身是有成本的,那些愿意在数据库中探索的开发人员,经常会发现修改ORM 的默认行为可以带来性能的提升。在本文中,我将分享在 Django 中使用数据库的 9 个技巧。1. 过滤器聚合(Aggregation with Filter)在 Django 2.0之前,如果我们想要得到诸如用户总数和活跃用户总数之类的东西,我们不得不求助于条件表达式:from django.contrib.auth.models import Use

2020-11-07 14:19:11 190

原创 python能自动解压各种压缩文件,你知道吗?

一、需求描述编写一个Python程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点:os 模块综合应用glob 模块综合应用利用 gzip zipfile rarfile tarfile 模块解压文件二、步骤分析和前置知识码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为:定时检测某个文件夹(如 download 文件夹)是否存在压缩文件如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中 删除压缩

2020-11-07 14:11:00 1744

原创 jupyter的这个最强插件你居然还不知道?

1 简介jupyter lab是我最喜欢的编辑器,在过往的文章中也给大家介绍过很多相关资源和实用插件,但本文要给大家介绍的jupyter lab插件elyra,绝对是我使用过的最强大的jupyter lab插件没有之一,因为它的核心功能就是帮助我们解决数据分析工作中非常重要的问题——「搭建工作流」。2 利用elyra搭建工作流在安装elyra插件集之前,请确保你的jupyter lab版本在2.0及以上,并且已经安装好了nodejs也就是所有jupyter lab拓展插件都需要的依赖。不像常规的j

2020-11-07 13:54:24 2430

原创 不花一分钱,获取了jetBrains所有产品的一年使用权

今天来给大家分享一下我申请的流程,因为学校没给我们申请学生邮箱(比较垃圾),所以之前一直没去申请,后面发现可以通过官方文件的认证来验证身份。学生的官方认证文件自然是从学信网来获取。学生认证这里我们主要会用到学信网和jetBrains学生认证的网页:https://my.chsi.com.cn/archive/index.jsphttps://www.jetbrains.com/shop/eform/students首先,我们需要拿到学信网的官方认证文件,这里其实有两种方法,我先讲下我是怎么弄得。

2020-11-07 13:38:27 510

原创 大神用python爬取AES加密的m3u8并且转换为MP4

最近发现一个视频网站,准备去爬取得时候,前面很顺利利用fiddler抓包获取网站的post数据loads为python字典数据,分析数据就能发现每个视频的连接地址就在其中发现这些都是m3u8文件流的形式并且加密的码字不易废话两句:有需要python学习资料的或者有技术问题交流 “点击”即可图key图片4最后实现代码如下:下载下来后用暴风音影可以播放,其他播放器要用格式工厂转换下格式,兄弟们注意身体啊!开发环境:windows+pyCharm+python3.5.2第三方模块:pip

2020-11-06 14:27:23 1114

原创 十个python热门项目,你知道几个

选择的十个项目包含了Debug工具、删除Facebook文章、无限云盘存储空间、AI 水军、并发运算工具、量化交易系统等等。那么就来看看这十个项目吧!第一名:PySnooper这是一款调试代码的工具,让你不需要再通过采用print 来定位错误发生的地方和原因。目前有11000+ 星。PySnooper 可以让你不需要仔细选择哪些行需要打印信息,只需要对目标函数添加一行装饰器,就可以知道很仔细看到函数的运行状况,包括哪行运行、局部变量的变化等。安装方法很简单,可以使用pip 或 anaconda两种

2020-11-06 14:19:25 876

原创 Jupyter Nptebook里面的这几个知识点你知道吗

如果你想用Python进行数据分析,那么Jupyter notebook是你必须要熟练掌握的工具之一,而Notebook也有很多省时好用的小技巧,本文将分享我在使用Notebook时习惯使用的一些操作!1.在Notebook中安装第三方库有时我们在进行数据分析的过程中,或者是使用一些在线/远程Notebook,需要临时安装一个第三方库,如果从命令行(甚至没有命令行界面)安装后再重启notebook,那么所有进度都将丢失!这时我们可以使用!pip install xxx 就可以直接在notebook将第

2020-11-06 14:00:27 244

原创 一个能让你免费问诊的python库

随着科技的发展,网上问诊也越来越火爆,各种网上付费的项目也是层出不穷,虽然有一定的效果,但是花费也是不少的,有的图片在线问诊需要花费上百元。这样让许多人感到了看病的压力。小编在上网的时候,看到了一个python的项目,是基于医药知识图谱的智能问答系统。可以帮助我们进行简单的问题的解答。而且是免费的哦。所以,小编今天就教授大家如何安装这个库,并进行简单的查询。项目的介绍这个项目是借助了REfO的python库实现了问答的系统,基于REfO模块的问答系统利用自然语言处理的技术,将我们输入的问题进行解析,

2020-11-05 15:40:56 1089 2

原创 微信图标能换颜色?

2011年的1月21日,微信诞生了。看惯了这个绿色的图标,有没有想过给它换个骚气蓬勃的颜色?今天给大家分享一个随意更改微信图标颜色的方法,各种颜色都有,安卓苹果都适用。效果如下:首先,我们需要下载一些微信颜色图标素材。码字不易废话两句:有需要python学习资料的或者有技术问题交流 “点击”即可安卓用户下载完成不要直接打开,长按手机桌面用挂件属性打开。下方找到微信,选择圆角方形的图标形状。再往下找到图标设置,点击这里改变图标。选择导入图标,点击从图库中选择图标然后再点

2020-11-05 15:30:28 2050

原创 这个它不比手动配置logging香多了?

在部署一些定时运行或者长期运行的任务时,为了留存一些导致程序出现异常或错误的信息,通常会才用日志的方式来进行记录这些信息。在 Python 中用到日志记录,那就不可避免地会用到内置的 logging标准库 。虽然logging 库采用的是模块化设计,你可以设置不同的 handler 来进行组合,但是在配置上通常较为繁琐;而且如果不是特别处理,在一些多线程或多进程的场景下使用 logging还会导致日志记录会出现错乱或是丢失的情况。但有这么一个库,它不仅能够减少繁琐的配置过程还能实现和logging类似的

2020-11-05 15:12:40 303

原创 写给正在准备学编程的小伙伴

可能你是一个学生,可能你是一个刚开始实习的应届毕业生,可能你和我之前一样,工作了好几年了…我不知道我们在哪一刻相遇。当你走进编程的世界,你的感受是什么呢?在很长的一段时间里,编程世界对于我来说是非常复杂的,它好像很有魅力,但又好像捉摸不透,你是不是也有这种感觉?前两天有朋友问我:你觉得我适合学习编程么?我不知道啊,是真的不知道怎么回答,首先我对他不是很了解,其次,我还没到那种一看就知道人家适合不适合的境界,要不然我现在也不会单身,不过说真的,我在编程后面加了一个“世界”,是因为:编程是一个需要

2020-11-05 15:01:30 154

原创 matplotlib必知的15个图,小知识系列

今天是讨论matplotlib绘图的最后一篇,这次以案例和代码为主需要导入的模块,matplotlib绘图,numpy几乎是必用的包。# 导入numpy模块import numpy as np# 导入pyplot模块import matplotlib.pyplot as plt案例1基本折线图# 创建序列[1,2,3,...,99]X = range(100)# X中元素依次取平方Y = [value ** 2 for value in X]plt.plot(X, Y)plt.sh

2020-11-04 15:44:01 271

原创 223个Python小例子,面试必问!

元素都为真接受一个可迭代对象,如果可迭代对象的所有元素都为真,那么返回 True,否则返回False元素至少一个为真接受一个可迭代对象,如果可迭代对象里至少有一个元素为真,那么返回True,否则返回Falseascii展示对象调用对象的 _repr_ 方法,获得该方法的返回值,如下例子返回值为字符串转为字典创建数据字典枚举对象返回一个可以枚举的对象,该对象的next()方法将返回一个元组。过滤器在函数中设定过滤条件,迭代元素,保留返回值为True的元素:动态获取对象属性

2020-11-04 15:30:34 254 1

原创 还在手写代码?用了这个工具,不用一行代码也能做出网站

制作网站用什么,Dreamweaver 还是Fireworks?现在,用 GPT-3 就可以。一位来自旧金山的程序员小哥做了款名为 debuild.co 的网页制作软件,只需要和 GPT-3“聊聊天”,它就能帮你把网站设计出来。例如,想要一个看起来像是 “西瓜”(watermelon)的按钮。那么,把想实现的功能原封不动地告诉 GPT-3 就行!看,GPT-3 “思考” 了一下,就实现了这个想法,生成的按钮的确有点像被切开的西瓜。类似地,其他更复杂的功能,这个程序也能替你完成。掷骰子 or

2020-11-04 14:56:14 216

原创 用python做了一个绝地求生外g???

玩吃鸡时间长的鸡友们 应该都知道现在的游戏环境非常差 特别在高端局 神仙满天飞 搞得很多普通玩家非常没有游戏体验因为吃鸡的火爆 衍生出了一条巨大的外挂利益链 导致市面上出现了各式各样的外挂正是因为现在的神仙满天飞 像我这种菜逼实在没办法生存下去 我的报复欲促使我开始了科学研究先给大家介绍一下现在市面上的外挂种类传统外挂fps游戏都有一个共同的特点,大部分计算都是本地完成的,不可能每一个动作都和服务器交互,有几个原因:会造成服务器负荷过大,提高运营成本在对枪杀人时,几十ms的延迟可能会扭转战局

2020-11-04 14:46:50 2379

原创 摸鱼吗?不会我教你啊

今天给大家一款摸鱼神器,把 VS Code 变身小霸王游戏机!https://marketplace.visualstudio.com/items?itemName=gamedilong.anes在安装好“小霸王”插件后,在左侧活动栏可以看到一个小霸王游戏机的图标,点击就能显示出小霸王的游戏列表。在 Remote 列表中,就可以把游戏下载到本地了!在 Local 列表中,单击选择你想玩的游戏,开始自由飞翔吧!(友情提示:玩的时候,记得打开一些代码文件,方便快速切换,摸鱼不被发现!)码字不易废话两

2020-11-03 15:05:28 1724 5

原创 让我们一起来看看GitHub上的自动刷喵币项目

一年一度的双十一大促又来了,原以为今年总算不需要帮忙盖楼了,奈何还有沉迷于助力的小同事:而且从昨天开始,【组队比拼】又来了,你没点人气都不好意思帮人助力了,想要人气你就得做任务,但一看到这个任务列表,放弃的心都有了…不过谁叫我们是程序员呢,随便一个脚本就能搞定,如果你不会写,网上一搜就可以找到一堆双十一脚本的源码。码字不易废话两句:有需要学习资料的或者有技术问题交流 “点击”即可这些脚本大多都采用find控件再click这种触发事件的方式,这样一来,整个脚本并没有直接去点击屏幕(在开发者模式是抓

2020-11-03 14:44:11 504

原创 大神用python爬取天气信息并且语言播报

一、 预备知识此案例实现功能:利用网络爬虫,爬取某地的天气,并打印和语音播报。要用到requests库,lxml库,pyttsx3库,没有的,可以先安装一下,都可以通过pip安装:pip install requestspip install lxmlpip install pyttsx3Requests库是个功能很强大的网络请求库,可以实现跟浏览器一样发送各种HTTP请求来获取网站的数据。Lxml库是处理XML和HTML功能最丰富,最易于使用的库,通常用lxml库中的etree使HTML

2020-11-03 13:38:26 300

原创 教你制作最近网上很火的,微信带小辫子表情包

有没有发现,最近很多人在发带有小辫子的表情符号。不知道的还以为微信又出新的表情符号呢。看这种辫子表情是不是很萌码字不易废话两句:有需要学习资料的或者有技术问题交流“点击”即可这个操作很多朋友还不知道怎么弄,下面就来为大家分享一下微信表情加小辫子操作教程。其实方法很简单辫子就是两个字符,我们只需要复制下图这个符号然后粘贴到微信聊天输入框再点击符号中间位置选择微信的任意一个表情插入其中带小辫子的表情就生成了是不是很卡哇伊为了方便输入,你还可以把该符号收藏到输入法中,下次输入的时候

2020-11-03 13:27:56 1149

原创 大神都已经在用python爬取高德地图了

一、 分析网页结构本篇博文就以高德地图展开:https://www.amap.com/在打开后,我们发现有一堆div标签,但是并没有我们需要的数据,这个时候就可以判定其为动态网页,这个时候,我们就需要找接口点击网络标签,我们可以看到网页向服务器发送了很多请求,数据很多,找起来太费时间我们点击XHR分类,可以减少很多不必要的文件,省下很多时间。XHR类型即通过XMLHttpRequest方法发送的请求,它可以在后台与服务器交换数据,这意味着可以在不加载整个网页的情况下,对网页某部分的内容进行更新

2020-11-02 15:20:59 600

原创 在python中实现如何实现自动导入缺失的库

导入失败问题,通常分为两种:一种是导入自己写的模块(即以.py 为后缀的文件),另一种是导入三方库。本文主要讨论第二种情况,今后有机会,我们再详细讨论其它的相关话题。解决导入Python库失败的问题,其实关键是在运行环境中装上缺失的库(注意是否是虚拟环境),或者使用恰当的替代方案。这个问题又分为三种情况:一、单个模块中缺失的库在编写代码的时候,如果我们需要使用某个三方库(如 requests),但不确定实际运行的环境是否装了它,那么可以这样:try: import requestsexce

2020-11-02 15:09:31 413 1

原创 python中的管理文件神器 os.walk

有没有想过用python写一个文件管理程序?听起来似乎没思路?其实是可以的,因为python已经为你准备好了神器os.walk,进来看看吧!python中os.walk是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。本文将详细介绍os.walk模块,最后使用os.walk模块实现一个在指定日志整理文件的程序。一、 基本介绍os.walk():扫描某个指定目录下所包含的子目录和文件,返回的是一个迭代器。二、 基本使用假设文件夹data有如下的目录结构(cmd 命令:t

2020-11-02 14:46:11 282

原创 用python制作一个PDF转换器

想必小伙伴都经历过,当你想要把PDF转为WORD时,自己打字赫赫甩在你眼前一、思路分析网上一搜,你可以发现很多PDF转换的工具,其中不乏在线转换的网站,比如这样的:那么,通过网站提供的测试接口,我们便可以通过爬虫模拟的方式实现转换。没有错了~思路就是如此的简单明了,今天的主角便是:https://app.xunjiepdf.com通过抓包分析,知道这是一个POST请求,接下来用requests库模拟即可。需要注意的是,这个接口仅用于测试,所以可供转换的页面等都有所限制,如需更完整的功能还请

2020-11-02 14:35:22 662 1

原创 大神教你用python识别电脑上面的恶意软件

导读:本文将利用静态分析技术揭示这些恶意软件的功能。在本文中,我们将介绍恶意软件静态分析的基础知识。静态分析是对程序文件的反汇编代码、图形图像、可打印字符串和其他磁盘资源进行分析,是一种不需要实际运行程序的逆向工程。虽然静态分析技术有欠缺之处,但是它可以帮助我们理解各种各样的恶意软件。通过细致的逆向工程,你将能够更好地理解恶意软件二进制文件在攻击目标后为攻击者提供的好处,以及攻击者可以隐藏并继续攻击受感染计算机的方式。正如你将看到的,本文结合了描述和实例,每个部分都介绍了静态分析技术,然后说明其在实际分

2020-11-02 14:18:13 874

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除