自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 在 pandas 上使用 apply() 方法

今天给大家带来一篇,如果觉得不错,欢迎关注起来。本文的内容主要如下:在 Pandas Series 上使用 apply() 方法在 Pandas Dataframe 上使用 apply() 方法使用 apply() 方法的四个用例apply() 方法主要用于,它专注于将方法应用于 pandas Series 中的每个元素以及 pandas DataFrame 的每一行/列。

2022-09-23 17:41:14 2308 1

原创 一文读懂 Python 装饰器

在 Python 中,函数是一种非常灵活的结构,我们可以把它赋值给变量、当作参数传递给另一个函数,或者当成某个函数的输出。装饰器本质上也是一种函数,它可以让其它函数在不经过修改的情况下增加一些功能。这也就是「装饰」的意义,这种「装饰」本身代表着一种功能,如果用它修饰不同的函数,那么也就是为这些函数增加这种功能。一般而言,我们可以使用装饰器提供的 @ 语法糖(Syntactic Sugar)来修饰其它函数或对象。@decpass。

2022-09-23 17:28:02 243

原创 太好用了,这个更人性化的正则库 -- Humre

这个库其实很新,第一次 commit 是在 2022/7/21,作者是 Al Sweigart,就是写 pyautogui 库(已有 7.1k star)的那个人,所以还是有一定可信赖度的。当然,这个库好用是好用的,但距离成熟可能还有一点时间哈,在 1.0 版本之前,其中的 API 可能还会迭代,所以还不建议直接上生产环境。好了,这里主要就是给大家介绍下这个正则库,有了它,我们的正则表达式就可以变得更加清晰易读,希望对大家有帮助~整体这么一拆分,并添加注释和分级,是不是可读性就大大增强了?

2022-09-22 17:00:19 456

原创 超全面, 15 种 Python IDE 工具使用对比

Github 为 Atom 开发了强大的功能,以提供良好的编程体验,包括多个插件,如 SQL queries 包、Markdown Preview Plus 包,以及编辑、可视化和渲染 LaTeX 公式的包。VS Code 是完整的代码编辑器,具备很多优秀功能,许多程序员称其为最好的 IDE 编辑器。本质上,IDE 是一种改进代码创建、测试和 debug 流程的工具,它使这些工作更加简单。另一个适合新手的地方是,你可以看到 Python 在每一步中对你的表达式的评估。它使用广泛,可用于不同的平台。

2022-09-22 15:30:53 383

原创 4 种 Python 连接 MySQL 数据库的方法

我们分享了可以使用的四种不同的常用连接方法,并在PlanetScale数据库上使用SSL对它们进行了测试,这是一个关键的步骤,因为它可以防止中间人攻击。注意,这个路径取决于你的平台。如果你需要一个免费的数据库来测试你的连接,PlanetScale是一个很好的选择。用 Python 连接到 MySQL 数据库的方法不是很系统,实际中有几种不同的连接方法,而且不是所有的方法都能与不同的操作系统很好地配合。如果你使用的是Windows系统,你需要下载根证书,然后用你所使用的驱动程序的正确配置选项指向它们的位置。

2022-09-21 17:58:27 6684 1

原创 一个 Python 的轻量级搜索工具 -- Whose

Whoosh 由 Matt Chaput 创建,它一开始是一个为 Houdini 3D 动画软件包的在线文档提供简单、快速的搜索服务工具,之后便慢慢成为一个成熟的搜索解决工具并已开源。Whoosh 纯由 Python 编写而成,是一个灵活的,方便的,轻量级的搜索引擎工具,现在同时支持 Python2、3,其优点如下:Whoosh 纯由 Python 编写而成,但很快,只需要 Python 环境即可,不需要编译器;默认使用 Okapi BM25F 排序算法,也支持其他排序算法;

2022-09-21 17:55:21 130

原创 盘点10个让工作效率倍增且有趣的 Python工具包

是微软推出的一款人工智能库,可以将传统人工智能模型编译成张量计算,了解深度学习框架,如Tensorflow、Pytorch的同学一定知道张量的重要性。可以看出,出错的文件、所在行、所在函数或模块都被用不同的颜色标记出来,比起左边密密麻麻、眼花缭乱的错误提示,显然是优化过的提示更人性化!用于以编程方式控制鼠标和键盘。是用来处理地理空间数据的工具库,不仅完美融合了pandas数据类型,还提供了操作地理空间数据的高级接口。是一个交互式的、开源的、基于浏览器的Python图形库,提供了30多种图表类型,包括。

2022-09-20 18:16:10 436

原创 Pandas/NumPy中的几个加速方法

二者在日常的数据分析中都发挥着重要作用,如果没有 Numpy 和 Pandas 的支持,数据分析将变得异常困难。Numpy 是用于科学计算的 Python 语言扩展包,通常包含强大的 N 维数组对象、复杂函数、用于整合 C/C++和 Fortran 代码的工具以及有用的线性代数、傅里叶变换和随机数生成能力。当一个数据帧分配给另一个数据帧时,如果对其中一个数据帧进行更改,另一个数据帧的值也将发生更改。这个函数的参数可设置为包含所有拥有特定数据类型的列,亦或者设置为排除具有特定数据类型的列。

2022-09-19 18:08:08 360

原创 MySQL 如何查找删除重复行?

类似,如果排序的是c字段,相同值的b也会分到不同的组,无论如何是不能达到我们的目的的。没有一个能够找出全部的重复行。而且最令人沮丧的是,对于某些情况,这种语句是有效的,如果错误地以为就是这么写法,然而对于另外的情况,很可能得到错误结果。一个常见的任务是,重复行只保留一行,其他删除,然后你可以创建适当的索引,防止以后再有重复的行写入数据库。这人试了很多其他的OR和AND的组合,用来分组的是一个字段,计算大小的是另一个字段,像这样。因为WHERE子句过滤的是分组之前的行,HAVING子句过滤的是分组之后的行。

2022-09-19 18:01:11 136

原创 Python 实现单例模式的五种写法

如果在程序运行期间,有很多地方都需要使用配置文件的内容,也就是说,很多地方都需要创建 AppConfig 对象的实例,这就导致系统中存在多个 AppConfig 的实例对象,而这样会严重浪费内存资源,尤其是在配置文件内容很多的情况下。类由 type 创建,创建类时,type 的 __init__ 方法自动执行,类() 执行 type 的 __call__ 方法(类的 __new__ 方法,类的 __init__ 方法)通过上面例子,我们可以知道,当我们实现单例时,为了保证线程安全需要在内部加入锁。

2022-09-17 22:18:18 125

原创 用python开发一个炸金花小游戏,注意别玩上瘾了~~

众所周知扑克牌可谓是居家旅行、桌面交友的必备道具,今天我们用Python来实现一个类似的扑克牌小游戏,先来看一下基本的游戏规则。炸(诈)金花又叫三张牌,是在全国广泛流传的一种民间多人纸牌游戏。游戏使用一副除去大小王的扑克牌,共 4 个花色 52 张牌,各个玩家从中抽取 3 张牌,比较大小。各种牌型的大小顺序如下(按照全排列组合中出现的概率越小,牌型分数奖励越大):1、同花顺:三张同样花色且点数连续的牌,如红心2、红心3、红心4;2、豹子:三张点数一样的牌,如 AAA、222;

2022-09-16 22:59:19 471

原创 4个Python项目管理与构建工具,建议收藏 ~

Python 历时这么久以来至今还未有一个事实上标准的项目管理及构建工具,以至于造成 Python 项目的结构与构建方式五花八门。这或许是体现了 Python 的自由意志。不像 Java 在经历了最初的手工构建,到半自动化的 Ant, 再到 Maven 基本就是事实上的标准了。

2022-09-15 22:36:16 139

原创 使用 Excel 和 Python 从互联网获取数据

人生苦短,快学Python!互联网上有极其丰富的数据资源可以使用。使用Excel可以自动读取部分网页中的表格数据,使用Python编写爬虫程序可以读取网页的内容。今天的文章主要分为两个部分,一是用通过Python构建一个数据网站,二是分别使用Excel和Python从编写的Web网站上获取数据。

2022-09-15 22:27:35 422

原创 Python的一些日常高频写法

但是,当对象序列化后,就会更加方便,因为约定俗成的,接口间的调用或者发起的 web 请求,一般使用 json 串传输。...: def __call__(self): #定义了__call__方法的类的实例是可调用的。参数,但第一个参数需要是表示自身类的 cls 参数,可以来调用类的属性,类的方法,实例化对象等。很多场景,直接一个类对象,传输不方便。元类,确实使用不是那么多,也许先了解这些,就能应付一些场合。python五类参数:位置参数,关键字参数,默认参数,可变位置或关键字参数的使用。

2022-09-14 19:17:30 191

原创 Python 处理 PDF:PyMuPDF 的安装与使用

在介绍PyMuPDF之前,先来了解一下MuPDF,从命名形式中就可以看出,PyMuPDF是MuPDF的Python接口形式。MuPDFMuPDF是一个轻量级的PDF、XPS和电子书查看器。MuPDF由软件库、命令行工具和各种平台的查看器组成。MuPDF中的渲染器专为高质量抗锯齿图形量身定制。它以精确到像素的几分之一内的度量和间距呈现文本,以在屏幕上再现打印页面的外观时获得最高保真度。这个观察器很小,速度很快,但是很完整。它支持多种文档格式,如PDF、XPS、OpenXPS、CBZ、EPUB和。

2022-09-14 15:58:10 209

原创 超简单 Python 汉字拼音转换工具

可以见到,通过定义一个 kiss 函数,使用 register 装饰器,我们生成了一个新的 style,这个 style 可以直接被用于拼音的转换参数,非常方便。(可选1) 如果你用Python的目的是数据分析,可以直接安装Anaconda,它内置了Python和pip.3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal.(可选2) 此外,推荐大家用VSCode编辑器,它有许多的优点。如果你觉得模块输出效果不合你意,或者你想做特殊处理,可以通过。

2022-09-09 22:02:54 625

原创 Python 实现单例模式的五种写法

是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在。当你希望在整个系统中,某个类只能出现一个实例时,单例对象就能派上用场。比如,某个服务器程序的配置信息存放在一个文件中,客户端通过一个 AppConfig 的类来读取配置文件的信息。如果在程序运行期间,有很多地方都需要使用配置文件的内容,也就是说,很多地方都需要创建 AppConfig 对象的实例,这就导致系统中存在多个 AppConfig 的实例对象,而这样会严重浪费内存资源,尤其是在配置文件内容很多的情况下。

2022-09-09 18:39:16 81

原创 Python和Excel的完美结合:常用操作汇总(案例详析)

在以前,商业分析对应的英文单词是Business Analysis,大家用的分析工具是Excel,后来数据量大了,Excel应付不过来了(Excel最大支持行数为1048576行),人们开始转向python和R这样的分析工具了,这时候商业分析对应的单词是Business Analytics。因为Excel画出来的图能够交互,能够在图上进行一些简单操作,所以这里用的python的可视化库是plotly,案例就用我这个学期发展经济学课上的作业吧,当时的图都是用Excel画的,现在用python再画一遍。

2022-09-08 20:59:04 214

原创 python爬虫Selenium库详细教程

在我们爬取网页过程中,经常发现我们想要获得的数据并不能简单的通过解析HTML代码获取,这些数据是通过AJAX异步加载方式或经过JS渲染后才呈现在页面上显示出来。如果定位到父frame,是无法查找到子frame的信息的,因此需要切换到子frame再进行查找。如果条件不成立,则等待最长时间为等待时间,如果超过等待时间后仍然没有满足等待等待条件,则抛出异常。第二种,是直接使用find_element(),传入的第一个参数为需要使用的元素查找方法。元素交互是先获取一个元素,然后对获取的元素调用交互方法。

2022-09-08 20:45:19 2428

原创 Python办公软件自动化,5分钟掌握openpyxl操作

各种数据需要导入Excel?多个Excel要合并?目前,Python处理Excel文件有很多库,openpyxl算是其中功能和性能做的比较好的一个。接下来我将为大家介绍各种Excel操作。今天给大家分享一篇用openpyxl操作Excel的文章。打开大文件时,根据需求使用只读或只写模式减少内存消耗。遍历文件的所有行或列,可以使用。新建一个Excel文件。打开现有Excel文件。用来批量删除行和列。

2022-09-07 21:15:58 125

原创 超实用:整理了34个Python自动化办公库

人生苦短,快学Python!本次内容涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处理等所有能在办公场景实现自动化的库,希望能够对大家有所帮助。

2022-09-07 21:00:22 514

原创 python编程,一看就懂的代码示例讲解装饰器

摘要:本文先讲解python中对象的概念,在悟空问答的基础上全面讲解装饰器如何装饰类。

2022-09-06 20:58:10 176

原创 良心推荐,Python爬虫高手必备的8大技巧。

想要快速学习爬虫,最值得学习的语言一定是Python,Python应用场景比较多,比如:Web快速开发、爬虫、自动化运维等等,可以做简单网站、自动发帖脚本、收发邮件脚本、简单验证码识别脚本。

2022-09-06 20:49:04 201

原创 Python 教你用 Rows 快速操作csv文件

相比于 pandas 的 pd.read_csv, 我认为 Rows 的优势在于其易于理解的计算语法和各种方便的导出和转换语法。它能非常方便地提取pdf中的文字、将csv转换为sqlite文件、合并csv等,还能对csv文件执行sql语法,还是比较强大的。除了写Python代码外,你还可以直接使用Rows的命令行工具,下面介绍几个可能会经常被用到的工具。如果你用Python的目的是数据分析,可以直接安装Anaconda,它内置了Python和pip.此外,推荐大家用VSCode编辑器,它有许多的优点。

2022-09-05 11:06:52 546

原创 快来,一起用Python制作你的核酸检测日历

坐标是深圳,2022年以来,大部分时候要求24小时,少部分时候要求48小时,更少的时候要求72小时,没有更长的情况。本文根据我的核酸检测记录,制作成日历,将核酸检测记录可视化到日历中。

2022-09-05 11:01:29 802

原创 Python中下划线的5种含义你都知道吗?

本文介绍了Python中单下划线和双下划线("dunder")的各种含义和命名约定,名称修饰(name mangling)的工作原理,以及它如何影响你自己的Python类。让这些概念完全沉浸下来,以便你能够理解名称修饰的总体思路,以及我向您展示的一些其他的行为。让我们来看看这个列表,并寻找我们的原始变量名称foo,_bar和__baz - 我保证你会注意到一些有趣的变化。在文章结尾处,你可以找到一个简短的“速查表”,总结了五种不同的下划线命名约定及其含义,以及一个简短的视频教程,可让你亲身体验它们的行为。

2022-09-04 19:23:37 168

原创 Python 处理 PDF —— PyMuPDF 的安装与使用

在介绍PyMuPDF之前,先来了解一下MuPDF,从命名形式中就可以看出,PyMuPDF是MuPDF的Python接口形式。MuPDFMuPDF是一个轻量级的PDF、XPS和电子书查看器。MuPDF由软件库、命令行工具和各种平台的查看器组成。MuPDF中的渲染器专为高质量抗锯齿图形量身定制。它以精确到像素的几分之一内的度量和间距呈现文本,以在屏幕上再现打印页面的外观时获得最高保真度。这个观察器很小,速度很快,但是很完整。它支持多种文档格式,如PDF、XPS、OpenXPS、CBZ、EPUB和。

2022-09-04 19:16:11 357 1

原创 推荐7个好用的Python效率工具,拿走不谢。

Flask是目前十分流行的web框架。无论是需要引导数据库、创建好看的 XML 文档、填写您的持久性来强调测试它,还是从生产服务中获取的同名数据,Faker 都适合您。Selenium是一个用于Web应用程序测试的工具,可以从终端用户的角度来测试应用程序。有效的工具可以帮助我们更快捷地完成工作任务,所以就给大家分享几个认为好用的工具,也希望这7个Python的效率工具能够帮助到你。我们可以试着提取百度主页上搜索按钮的值,首先要找到按钮使用的类,一个inspect element显示该类为“ bt1”。

2022-09-03 16:26:50 361

原创 Python 操作 MySQL 数据库的三个模块

下面代码中的一对多关系,relationship 定义在了 customer 表中,应该定义在 PurchaseOrder 更合理?

2022-09-03 16:22:47 2863

原创 学机器学习之前,必须了解的数据清洗 & 预处理入门完整指南。

一种常见的方法是将数据集按 80/20 进行划分,其中 80% 的数据用作训练,20% 的数据用作测试。这表明,如果原始列的值为猫,那么就会在麋鹿一列得到 0,狗一列得到 0,猫一列得到 1。本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成数据预处理工作。现在,我们有了需要学习的模型。数据预处理是建立机器学习模型的第一步(也很可能是最重要的一步),对最终结果有决定性的作用:如果你的数据集没有完成数据清洗和预处理,那么你的模型很可能也不会有效——就是这么简单。

2022-09-02 16:24:47 618

原创 Python新用法,不要再写Python for循环了。

在大多数情况下,其实我们都不需要编写 for 循环。我们应该避免编写 for 循环,这样会有更好的代码可读性。

2022-09-02 16:05:02 167

原创 PyCharm一定要使用的5款插件,实用且酷炫

相信对于不少的Python程序员们都是用Pycharm作为开发时候的IDE来使用的。今天我来分享几个好用且酷炫的Pycharm插件,在安装上之后,你的编程效率、工作效率都能够得到极大地提升。不知道大家还知道哪些好用的插件呢,可以在评论区告诉我哦!...

2022-08-31 13:58:04 465

原创 纯干货分享,Python实现10大排序算法。

快速排序的名字起的是简单粗暴,因为一听到这个名字你就知道它存在的意义,就是快,而且效率高!插入排序是一种最简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是 O(nlogn) 的时间复杂度。......

2022-08-31 13:52:23 80

原创 超全Python读取文件方法,不容错过噢!

通常当我们处理不再需要使用的,需要立即关闭的对象(例如文件、数据库和网络连接)时,强烈推荐使用 with 语句。文件处理是一种用于创建文件、写入数据和从中读取数据的过程,Python 拥有丰富的用于处理不同文件类型的包,从而使得我们可以更加轻松方便的完成文件处理的工作。它是一个字符串列表,其中列表中的每个项目都是文本文件的一行,``\n` 转义字符表示文件中的新行。在访问文件的内容之前,我们需要打开文件。以下代码通过逐行迭代来输出整个文件,直到跟踪我们正在读取或写入文件的位置的文件指针到达文件末尾。...

2022-08-30 15:40:47 6496

原创 50个常用的 Numpy 函数详解

Numpy是python中最有用的工具之一。它可以有效地处理大容量数据。使用NumPy的最大原因之一是它有很多处理数组的函数。在本文中,将介绍NumPy在数据科学中最重要和最有用的一些函数。它用于创建一维或多维数组Dtype:生成数组所需的数据类型。ndim:指定生成数组的最小维度数。还可以使用此函数将pandas的df和series转为NumPy数组。创建一个具有指定间隔的浮点数的数组。start:起始数字end:结束Num:要生成的样本数,默认为50。在给定的间隔内返回具有一定步长的整数。...

2022-08-29 15:43:34 451

原创 Python 的 print( )输出函数

print[prɪnt]:打印。print的中文意思是打印、印刷,即将文字打印到纸张上。print( )函数在Python中的作用是将print( )函数括号里的内容输出到屏幕上。print( )函数:Python中的输出函数。【功能】将print( )函数括号中的内容打印或输出到屏幕上。2. print( )函数的语法print( )函数由4部分组成:...

2022-08-29 15:23:16 21487 1

原创 30个Python极简代码,10分钟get常用技巧

以下方法会检查给定的字符串是不是回文序列,它首先会把所有字母转化为小写,并移除非英文字母符号。以下方法将统计字符串中的元音 (‘a’, ‘e’, ‘i’, ‘o’, ‘u’) 的个数,它是通过正则表达式做的。这 个方法可以将布尔型的值去掉,例如(False,None,0,“”),它使用 filter() 函数。下面的代码可以将列表连接成单个字符串,且每一个元素间的分隔方式设置为了逗号。如下方法首先会应用一个给定的函数,然后再返回应用函数后结果有差别的列表元素。...

2022-08-28 21:38:24 71

原创 给大家总结了90条写Python程序的建议

(2)深入学习 Python 相关知识,比如语言特性、库特性等,比如Python演变过程等。(1)避免不规范代码,比如只用大小写区分变量、使用容易混淆的变量名、害怕过长变量名等。:理解 Python 与 C 的不同之处,比如缩进与 {},单引号双引号,三元操作符?:使用 Counter 进行计数统计,Counter 是字典类的子类,在 collections 模块中。:i+=1 不等于 ++i,在 Python 中,++i 前边的加号仅表示正,不表示操作。:[], {}和():一致的容器初始化形式。...

2022-08-28 21:17:22 111

原创 Python办公软件自动化,5分钟掌握openpyxl操作

各种数据需要导入Excel?多个Excel要合并?目前,Python处理Excel文件有很多库,openpyxl算是其中功能和性能做的比较好的一个。大家好,今天给大家分享一篇用openpyxl操作Excel的文章。打开大文件时,根据需求使用只读或只写模式减少内存消耗。接下来我将为大家介绍各种Excel操作。使用Worksheet.values。遍历文件的所有行或列,可以使用。新建一个Excel文件。打开现有Excel文件。用来批量删除行和列。...

2022-08-27 14:55:07 542

原创 10 种常用的数据分析思路,让你不再迷茫。

数据分析的思路及其重要,以致于我们总是忽略它,重“术”而轻“道”,但其实应该一视同仁。这篇文章讲了表单分析、用户分析、埋点分析、聚类分析等10种分析方法,先学为敬~

2022-08-27 14:23:10 377

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除