自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 收藏
  • 关注

原创 27个Python Data Science库 (实战代码)!

但是由于PIL仅支持到 Python 2.7,再加上年久失修,于是一群志愿者在 PIL 的基础上创建了兼容的版本,名字叫 Pillow,支持最新 Python 3.x,又加入了许多新特性,因此,我们可以跳过 PIL,直接安装使用 Pillow。NumPy(Numerical Python)是 Python的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,Numpy底层使用C语言编写,数组中直接存储对象,而不是存储对象指针,所以其运算效率远高于纯Python代码。

2024-08-10 14:24:28 528

原创 GitHub 标星 15w,如何用 Python 实现所有算法?

首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。插值搜索类似于人们在电话目录中搜索名称的方法(用于订购书籍条目的关键值):在每个步骤中,算法计算剩余搜索空间中的位置,基于搜索空间边界处的键值和所寻找的键的值,通常可以通过线性插值来寻找项目。这样的列表叫做h排序。因为基本拉丁字母中有26个字母(2×13),所以ROT13是自身的反转,也就是说,要撤消ROT13需要相同的算法,因此可以使用相同的动作进行编码和解码。

2024-08-10 14:10:32 484

原创 用Python写个自动批改作业系统!

作对了,能打对号;做错了,能打叉号;没做的,能补上答案。醒来后,我环顾四周,赶紧再躺下,希望梦还能接上。

2024-08-10 13:57:16 392

原创 再见nohup!试试这个神器,Python Supervisor!

Supervisor 是一个 C/S 架构的进程监控与管理工具,本文主要介绍其基本用法和部分高级特性,用于解决部署持久化进程的稳定性问题。Supervisor 是一个 C/S 架构的进程监控与管理工具,其最主要的特性是可以监控目标进程的运行状态,并在其异常中断时自动重启。同时支持对多个进程进行分组管理。完整特性详见官方文档 github 与 document。配置文件的一些主要配置参数如下;chmod=0700;;;;log level;;;;;;;;;;;;[include];

2024-08-10 13:22:24 405

原创 用Python优雅地写LaTeX

latexify用于生成 LaTeX 数学公式的 Python 库。LaTeX 是一种基于 ΤΕΧ 的排版系统,对于展示复杂的数学公式表现极为出色。该项目可以用 Python 函数,轻松生成复杂的 LaTeX 数学公式描述。

2024-08-10 13:17:02 240

原创 盘点10个Python优质可视化工具!

本次分享10个适用于多个学科的Python数据可视化库,其中有名气很大的也有鲜为人知的!

2024-08-10 13:12:06 837

原创 Python 命令补全工具 argcomplete

在使用Python 命令或者 Python的命令行工具的时候,一个痛点是没有补全。比如python -m后面输入包名字,就没有提示,每次想运行一个http server的时候,都需要搜索一下http服务的包名。另外,像pip,pipx等命令也没有提示,使用不太方便。偶然看到argcomplete[1]这个库,按tab键就可以给Python的命令行添加自动补全,简直是使用Python的一个神器。

2024-08-10 11:53:56 600

原创 这个Python库把Selenium按在地上摩擦!

DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器,也能收发数据包,还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大,内置无数人性化设计和便捷功能。它的语法简洁而优雅,代码量少,对新手友好。

2024-08-10 11:50:45 222

原创 友好的 Python:封装和复用!

这个 SDK 写成这样,可能是直接从别的语言直译过来的。不知从事 code review 的 @piglei 如何看待,能不能过你这关。如果阅读本文的你恰好就是维护这个 SDK 的人被我中伤了我深表抱歉,并绝对不改。

2024-08-10 11:43:50 462

原创 pywinauto,一款Win自动化利器!

键盘操作主要是按下键盘上的按键,相关方法在keyboard模块,最最主要的是send_keys()方法,第一个参数keys就是我们需要按下的按键,其他参数比如说with_spaces、with_tabs、with_newlines、turn_off_numlock、set_foreground、vk_packet,一看就知道作用,而且都是布尔值,此处不进行举例。鼠标点击肯定离不开点击的位置,桌面就是一个坐标,左上角为坐标原点,往右是X轴正向,往下是Y轴正向。Inspect和Spy++需要自己安装一下。

2024-08-10 11:38:33 539

原创 一图胜千言|图解Pandas常用操作!

Pandas 展示请看下表:它描述了一个在线商店的不同产品线,共有四种不同的产品。与前面的例子不同,它可以用NumPy数组或Pandas DataFrame表示。但让我们看一下它的一些常见操作。

2024-08-10 11:24:42 279

原创 pip、conda等7种Python包管理工具对比测评

一个可以进行 Python 版本管理的工具,可以让你轻松安装 Python 版本并在它们之间切换。环境管理工具,允许您创建和管理(虚拟)环境。包管理工具能够下载和安装库及其依赖项。FlitPoetrypdmHatchrye该工具是否管理依赖关系❌✅✅❌✅它是否解析/锁定依赖关系❌✅✅❌✅是否有干净的构建/发布流程✅✅✅✅✅它允许使用插件吗❌✅✅✅❌它支持 PEP 660(可编辑安装)吗✅✅✅✅✅它支持 PEP 621(项目元数据)吗✅。

2024-08-10 10:14:33 559

原创 10 个令人惊叹的 Python 自动化脚本!

你是否曾发现自己忙于处理多个文本片段,而忘记了自己复制了什么?有没有想过有一个工具可以记录你一天中复制的所有内容?这个自动化脚本可以监控你复制的所有内容,将复制的每个文本无缝地存储在一个时尚的图形界面中,这样你就不必在无尽的标签页中搜索,也不会丢失一些有价值的信息。该自动化脚本利用库的强大功能无缝捕获复制数据,并集成了以可视化方式跟踪和管理复制的文本。

2024-08-10 09:57:51 372

原创 用Python实现十大经典排序算法

排序算法是《数据结构与算法》中最基本的算法之一。排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。

2024-08-10 09:50:57 422

原创 MoviePy,一个超强的Python库!

MoviePy 是一个用于视频编辑的 Python 库,使用户能够处理、编辑和操作视频文件。这个库允许你剪辑视频、添加文本、合并视频剪辑,以及应用各种效果和转换。它建立在 NumPy、imageio 和 Decorator 等库的基础上,使得在处理视频时能够更加高效。MoviePy 允许你从现有视频中选择特定的片段,然后将它们合并成一个新的视频文件。你可以在视频中添加文本、图形和其他元素,以创建字幕、水印或其他视觉效果。

2024-08-10 09:40:44 754

原创 60个“特征工程”计算函数(Python代码)

近期一些朋友询问我关于如何做特征工程的问题,有没有什么适合初学者的有效操作。特征工程的问题往往需要具体问题具体分析,当然也有一些暴力的策略,可以在竞赛初赛前期可以带来较大提升,而很多竞赛往往依赖这些信息就可以拿到非常好的效果,剩余的则需要结合业务逻辑以及很多其他的技巧,此处我们将平时用得最多的聚合操作罗列在下方。最近刚好看到一篇文章汇总了非常多的聚合函数,就摘录在下方,供许多初入竞赛的朋友参考。

2024-08-09 13:07:48 433

原创 太强了,这几个Python效率工具非常好用!

为了提高效率,我们在平时工作中常会用到一些Python的效率工具,Python作为比较老的编程语言,它可以实现日常工作的各种自动化。为了更便利的开发项目,这里给大家推荐几个Python的效率工具。

2024-08-08 17:58:17 500

原创 自动爬虫神器,强烈推荐!不用再手动撸代码啦~

日常我们用Python来实现的上述爬虫的话,至少得几百行代码,而且还要处理动态页面、登录、反爬等各种麻烦的事,用八爪鱼就显得轻而易举啦。不仅如此,还可以通过爬虫变现,7月也正处于爬虫接单旺季,爬虫的需求量与日俱增,看到其他人的爬虫接单记录,竟然报酬那么多!如果能有简单好上手的自动化爬虫工具,不仅不用去研究各种网站的反爬机制,还可以节省写代码的时间,提高效率,这里推荐。八爪鱼是我平时经常推荐给粉丝的软件,它是一款功能强大的桌面端爬虫软件,直观的图形化操作界面,

2024-08-08 17:53:31 423

原创 10 个 Python 自动探索性数据分析神库!

Dataprep是我最常用的EDA包,AutoViz和D-table也是不错的选择,如果你需要定制化分析可以使用Klib,SpeedML整合的东西比较多,单独使用它啊进行EDA分析不是特别的适用,其他的包可以根据个人喜好选择,其实都还是很好用的,最后edaviz就不要考虑了,因为已经不开源了。通过自动化的工作可以节省我们的很多时间。klibe虽然提供了很多的分析函数,但是对于每一个分析需要我们手动的编写代码,所以只能说是半自动化的操作,但是如果我们需要更定制化的分析,他是非常方便的。

2024-08-08 17:38:47 792

原创 干货|字符串大小写转换用法

title() 方法用于将字符串中每个单词的首字母转为大写,其他字母全部转为小写,转换完成后,此方法会返回转换得到的字符串。upper() 的功能和 lower() 方法恰好相反,它用于将字符串中的所有小写字母转换为大写字母,和以上两种方法的返回方式相同,即如果转换成功,则返回新字符串;反之,则返回原字符串。lower() 方法用于将字符串中的所有大写字母转换为小写字母,转换完成后,该方法会返回新得到的字符串。需要注意的是,以上 3 个方法都仅限于将转换后的新字符串返回,而不会修改原字符串。

2024-08-08 14:03:14 197

原创 编译型语言和解释型语言

通过高级语言编写的源码,我们能够轻松理解,但对于计算机来说,它只认识二进制指令,源码就是天书,根本无法识别。源码要想执行,必须先转换成二进制指令。所谓二进制指令,也就是由 0 和 1 组成的机器码,能被计算机直接识别并执行。然而,究竟在什么时候将源代码转换成二进制指令呢?不同的编程语言有不同的规定:有的编程语言要求必须提前将所有源代码一次性转换成二进制指令,也就是生成一个可执行程序(比如 Windows 下的 .exe 文件),比如C语言、C++、Golang、汇编语言等,它们都属于。

2024-08-08 14:00:54 908

原创 干货|Python中find() 方法

位于索引(2,-4)之间的字符串为“biancheng”,由于其不包含“.”,因此 find() 方法的返回值为 -1。find() 方法用于检索字符串中是否包含目标字符串,如果包含,则返回第一次出现该字符串的索引;用 find() 方法检索 “c.biancheng.net” 中首次出现 “.” 的位置索引。start:表示开始检索的起始位置。end:表示结束检索的结束位置。如果不指定,则默认一直检索到结尾。手动指定起始索引和结束索引的位置。sub:表示要检索的目标字符串;手动指定起始索引的位置。

2024-08-08 13:57:17 179

原创 干货|字符串编码转换的2种方法

在 Python 中,有 2 种常用的字符串类型,分别为 str 和 bytes 类型,其中 str 用来表示 Unicode 字符,bytes 用来表示二进制数据。随着信息技术的发展,各国的文字都需要进行编码,于是相继出现了 GBK、GB2312、UTF-8 编码等,其中 GBK 和 GB2312 是我国制定的中文编码标准,规定英文字符母占用 1 个字节,中文字符占用 2 个字节。注意:格式中用 [] 括起来的参数为可选参数,也就是说,在使用此方法时,可以使用 [] 中的参数,也可以不使用。

2024-08-08 13:56:15 795

原创 干货|使用python进行音频格式转换

Pydub是一个基于ffmpeg的Python音频处理模块,封装了许多ffmpeg底层接口,因此用它来做音乐歌曲文件格式转换会非常方便。下载,解压,安装之后,打开计算机环境变量,在Path路径中添加ffmpeg中的bin目录路径。现在,尝试将一个文件夹下的所有非mp3音频格式的文件转化为mp3音频格式:​​​​​​​。可以继续封装该函数,将单个mp3文件转化为任意其他音乐音频格式:​​​​​​​。只要是ffmpeg支持的音乐音频格式,它都可以转换。下载安装ffmpeg,并配置环境变量。

2024-08-08 13:53:24 350

原创 使用Python快速查找电脑里的文件

电脑随着使用时间的增加,我们在电脑中储存的文件变得越来越多。当这个时候你想要查找一个文件,但是又忘记了文件的位置在哪,想通过排序查找这个文件,又由于文件夹里面文件太多,根本找不到。提供了多数操作系统的功能接口函数,当os模块被导入后,它会自适应于不同的操作系统平台,根据不同的平台进行相应的操作,在Python编程时,经常使用os模块与文件、目录打交道。那么在面对海量的存储文件,其实我们可以通过其实我们可以通过Python实现本机文件的检索,帮助大家找到遗忘在电脑某处的文件。

2024-08-08 13:50:17 321

原创 干货|关于Python for循环

在 python 中,for …else 表示这样的意思,for 中的语句和普通的没有区别,else 中的语句会在循环正常执行完(即 for 不是通过 break 跳出而中断的)的情况下执行,while …else 也是一样。以上实例我们使用了内置函数 len() 和 range(),函数 len() 返回列表的长度,即元素的个数。range返回一个序列的数。Python for循环可以遍历任何序列的项目,如一个列表或者一个字符串。另外一种执行循环的遍历方式是通过索引,如下实例:​​​​​​​。

2024-08-08 13:30:37 188

原创 干货|Python 异常处理

python提供了两个非常重要的功能来处理python程序在运行中出现的异常和错误。异常名称描述所有异常的基类SystemExit解释器请求退出用户中断执行(通常是输入^C)Exception常规错误的基类迭代器没有更多的值生成器(generator)发生异常来通知退出所有的内建标准异常的基类所有数值计算错误的基类浮点计算错误数值运算超出最大限制除(或取模)零 (所有数据类型)断言语句失败对象没有这个属性EOFError没有内建输入,到达EOF 标记操作系统错误的基类。

2024-08-08 13:27:55 552

原创 干货|Python条件语句

Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。可以通过下图来简单了解条件语句的执行过程:Python程序语言指定任何非0和非空(null)值为true,0 或者 null为false。其中"判断条件"成立时(非零),则执行后面的语句,而执行内容可以多行,以缩进来区分表示同一范围。else 为可选语句,当需要在条件不成立时执行内容则可以执行相关语句。

2024-08-08 13:25:25 227

原创 干货|Python XML解析

XML 指可扩展标记语言XML 被设计用来传输和存储数据。XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。

2024-08-08 13:22:16 610

原创 干货| 4 个 Python 推导式开发技巧

它的工作原理与列表推导式完全相似,唯一的区别是——创建一个列表推导式时,你将所有内容都包含在方括号中,例如[],而在字典推导式中,你将所有内容都包含在花括号中,例如{}。对于数据科学,Python通常被广泛地用于进行数据的处理和转换,它提供了强大的数据结构处理的函数,使数据处理更加灵活,这里说的“灵活性”是什么意思?这意味着在Python中总是有多种方法来实现相同的结果,我们总是有不同的方法并且需要从中选择易于使用、省时并能更好控制的方法。例如,想用一个标量(即数字5)乘以列表中的每一项。

2024-08-07 18:01:52 470

原创 干货| Python实现循环的最快方式

对于上面的求等差数列之和的操作,借助于Python内置的Sum函数,可以获得远大于 For或While循环的执行效率。内置函数Sum的累加操作实际上也是一种循环,但它由C语言实现,而For循环中的求和操作是由纯Python代码s += i实现的。假如任意一种简单的单步操作耗费的时间为1个单位,将此操作重复执行上万次,最终耗费的时间也将增长上万倍。这里的思路就是,既然循环的效率低,一段代码要重复执行上亿次。While和For是Python中常用的两种实现循环的关键字,它们的运行效率实际上是有差距的。

2024-08-07 17:57:50 159

原创 干货| 10 个图像处理的Python库

它提供了一个简单而强大的API,使用户能够轻松地处理图像和视频数据。timm是一个PyTorch模型库,虽然可能和图像处理没有关系,但是它提供了广泛的预训练模型和计算机视觉模型的集合,这对我们来进行深度学习的时候是非常有帮助的。在这篇文章中,我们将整理计算机视觉项目中常用的Python库,如果你想进入计算机视觉领域,可以先了解下本文介绍的库,这会对你的工作很有帮助。Pillow是一个通用且用户友好的Python库,提供了丰富的函数集和对各种图像格式的支持,使其成为开发人员在其项目中处理图像的必要工具。

2024-08-07 17:55:02 560

原创 Python语法基础常识

初步学习print函数时,我们可以看到print函数分别有无引号、单引号、三引号用法,即print()、print(' ')、print(''' ''')用法,他们之间的用法分别是怎样的呢?number='3.1415926',那么这行代码中,number就是变量,我们把数字“3.1415926”赋值给了number。print('')则是用于文字输出,当我们想要让计算机打出非纯数字内容时,就得在print函数中用单引号''。当然,可能有同学会好奇:“那我能不能不用单引号,用双引号呢?

2024-08-07 17:42:24 432

原创 干货|Python进阶常用技巧!

最后,如果 CPU 的运行时间超过了限制,我们将发出系统退出的信号。当我们定义了「__slots__」属性时,Python 没有使用字典来表示属性,而是使用小的固定大小的数组,这大大减少了每个实例所需的内存。这只是个很简单的例子,我们可以更进一步,使用「unicodedata」程序包生成大型重映射表,并使用其中的「combining()」进行生成和映射,我们可以。同样,我们可以让「__all__」为空,这样就不会导出任何东西,当从这个模块导入的时候,会造成「AttributeError」。

2024-08-07 17:35:08 367

原创 干货|30 个Python代码常用功能

通过指定end参数的值,可以取消在末尾输出回车符,实现不换行。** 善于使用 range() ,会使问题变得简单。15、随机生成验证码的两种方式。

2024-08-07 17:31:03 271

原创 【Python 从入门到精通推荐书籍】

推荐几本在豆瓣评分很不错的学习书籍,这些书的电子版被我搜集整理了出来,今天分享给大家。

2024-08-01 15:04:13 412

原创 【连肝两个通宵!python爬虫基础介绍及学习路线推荐!!】

当然你可能发现爬回来的数据并不是干净的,可能会有缺失、错误等等,你还需要对数据进行清洗,可以学习 pandas 包的基本用法来做数据的预处理,得到更干净的数据。书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

2024-08-01 11:08:18 651

原创 Python爬虫基础学习.3

与上一个例子爬取“最好大学排名”不同,淘宝商品信息不像之前的大学信息是以HTML格式嵌入的,这里的商品信息并未以HTML标签的形式处理数据,而是直接以脚本语言放进来的,所以不需要用BeautifulSoup来解析,直接用正则表达式提取 关键字信息即可。所以商品名称和商品价格分别是以 “raw_title”:“名称” 和 “view_price”:“价格”,这样的键/值对的形式展示的。经过对比发现,翻页后,变化的关键字是s,每次翻页,s便以44的倍数增长(可以数一下每页显示的商品数量,刚好是44)

2024-07-22 13:13:21 368

原创 Python爬虫基础学习.2

可以看到需要的一些信息如大学排名、大学名称、地址、分数等分别在如图标注的地方,每个大学信息所在的标签结构如下:所有大学信息都在标签下,每个大学都在各自的标签,然后大学自身的排名、名称、地址等信息都分别由一个标签包裹。因为不只有我们需要的大学信息用到了标签,之外也有用到标签来包裹内容的)。我要把每个学校的“排名、名称、地址、分数”的值都取出来,并且把每组数据都各自装在一个列表中,然后再把每个列表依次加到一个大列表里。那么,如果要从每个t对象中获取a标签的内容,并把所有a标签都保存到一个列表中,该如何做?

2024-07-22 09:39:55 318

原创 python基础爬虫学习.1

常用通过find_all()方法来查找标签元素:<>.find_all(name, attrs, recursive, string, **kwargs) ,返回一个。BeautifulSoup库通俗来说是【解析、遍历、维护“标签树”(例如html、xml等格式的数据对象)的功能库 】得到一个BeautifulSoup对象后,一般通过BeautifulSoup类的基本元素来提取html中的内容。• attrs:对标签属性值的检索字符串,可标注属性检索。• name:对标签名称的检索字符串。

2024-07-20 17:13:02 610

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除