python
文章平均质量分 60
不死鸟.亚历山大.狼崽子
太极计算机股份有限公司系统架构师,从事ios、.net、flex、java等开发
展开
-
python进阶(8):yield函数
带有yield的函数在Python中被称之为generator(生成器),也就是说,当你调用这个函数的时候,函数内部的代码并不立即执行 ,这个函数只是返回一个生成器(Generator Iterator)。原创 2024-08-29 09:57:41 · 971 阅读 · 0 评论 -
python库(21):TextBlob库实现文本处理
TextBlob 是一个基于 Python 的文本处理库,能够让基础的自然语言处理任务变得异常简单。它提供了一个简单直观的 API,让你能够轻松执行词性标注、名词短语提取、情感分析、文本分类和关键词提取等功能。值得一提的是,TextBlob 实际上是对 NLTK(自然语言工具包)的一种扩展,这让新手和熟练的开发者能够以更高的层面轻松完成复杂的 NLP 任务。特性简洁的API:提供了一个用户友好的接口来执行常见的文本处理任务。语言支持:支持多种语言的处理。原创 2024-08-25 23:00:03 · 1064 阅读 · 0 评论 -
python库(20):Jsonschema库描述JSON数据的规范
在当今信息时代,数据规范与交换变得越来越重要,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,被广泛应用于网络通信与前后端数据交互。JSON Schema是一种用于描述JSON数据的规范,可以用来定义JSON数据对象的结构、格式和约束条件。通过JSON Schema,可以对JSON数据进行验证、校验和文档化,确保数据的正确性和完整性。原创 2024-08-25 17:13:26 · 265 阅读 · 0 评论 -
python基础篇(15):闭包
在函数嵌套的前提下,内部函数使用了外部函数的变量,并且外部函数返回了内部函数,我们把这个使用外部函数变量的内部函数称为闭包。原创 2024-08-18 16:09:43 · 245 阅读 · 0 评论 -
python库(19):flashtext库实现高效文本查找与替换
FlashText 是一个用于高效查找和替换关键词的 Python 库。它的优势在于能够在 O(n) 时间复杂度内完成任务,而不是像正则表达式那样需要 O(m*n) 的时间复杂度。FlashText 使用 Aho-Corasick 自动机算法,在大量关键词匹配时表现尤为出色。flashtext的主要特点flashtext被设计为高性能工具,可快速处理大规模文本数据,适用于大数据分析和处理任务。flashtext提供了简单而直观的API,使用户能够轻松地执行文本搜索和替换操作,无需复杂的正则表达式。原创 2024-08-06 17:09:26 · 502 阅读 · 0 评论 -
python库(18):Sympy库
Python SymPy是一个强大的符号计算库,用于解决数学问题、代数运算、微积分、代数方程求解和符号化处理等任务。SymPy的设计目标是提供一个开源、可扩展的符号计算工具,使数学建模和问题求解变得更加容易。本文将提供关于Python SymPy的全面指南,包括基本概念、安装和配置、符号表达式、代数运算、微积分、方程求解、矩阵操作以及实际应用场景。将通过丰富的示例代码来帮助深入理解SymPy的使用。与我们常用的数学库NumPy不同,Sympy能够处理符号表达式,而不仅仅是数值计算。原创 2024-08-05 10:07:03 · 866 阅读 · 0 评论 -
python库(17):pkuseg库实现文本分词
PKUSEG,全称“北京大学语言计算与机器学习研究组开发的分词工具”,它就像一把锋利的瑞士军刀,帮助我们轻松切割文本。在Python的文本处理领域,有很多分词工具,比如jieba、SnowNLP等。但是,PKUSEG以其高精度和易用性脱颖而出。它不仅能够进行基本的分词,还能识别词性,甚至能够处理一些复杂的语言现象,比如新词识别和歧义消解。PKUSEG的功能远不止于此,它还可以用于命名实体识别、关键词提取等高级文本分析任务。原创 2024-08-02 02:19:06 · 609 阅读 · 0 评论 -
python库(16):Attrs库创建具有属性的对象
attrs库,即Attribute的缩写,是一个Python第三方库,它提供了一种优雅的方式来定义具有属性的类。使用attrs,你可以用更少的代码,更清晰的方式定义类和对象。原创 2024-07-31 16:40:26 · 557 阅读 · 0 评论 -
python基础篇(14):多态
多态(Polymorphism),顾名思义,就是多种形态。在面向对象编程(OOP)中,它指的是允许你使用一个接口来表示不同的类型的能力。简单来说,就是同一种行为可以根据发送消息的对象的不同而采用不同的行为方式。多态常作用在继承关系上.比如函数(方法)形参声明接收父类对象实际传入父类的子类对象进行工作以父类做定义声明以子类做实际工作用以获得同一行为, 不同状态。原创 2024-07-29 00:02:11 · 363 阅读 · 0 评论 -
python基础篇(13):类型注解
Python在3.5版本的时候引入了类型注解,以方便静态类型检查工具,IDE等第三方工具。类型注解:在代码中涉及数据交互的地方,提供数据类型的注解(显式的说明)。帮助第三方IDE工具(如PyCharm)对代码进行类型推断,协助做代码提示帮助开发者自身对变量进行类型注释变量的类型注解函数(方法)形参列表和返回值的类型注解。原创 2024-07-28 16:18:58 · 182 阅读 · 0 评论 -
python进阶(7):dataclass数据类使用
Python3.7引入了dataclass。dataclass装饰器可以声明Python类为数据类;数据类表示某种数据类型,数据对象代表一种特定类的实体,包含了实体的属性。同类型的对象之间可以进行比较;如,大于、小于或等于。dataclass与普通类的区别与普通类相比,dataclass通常不包含私有属性,这些属性可以直接访问(也可以私有);repr() 函数将对象转化为供解释器读取的形式;dataclass的repr方法通常有其固定格式,会打印类名、属性名、属性值;原创 2024-07-25 10:45:41 · 337 阅读 · 0 评论 -
python库(15):furl库操作URL
Python内置的urllib库提供了基本的URL操作功能,但它往往比较繁琐。furl是一个功能强大且易于使用的URL处理库,旨在简化URL的构建、解析和操作。本文将详细介绍furl库,并通过多个代码示例帮助你掌握它的使用。原创 2024-07-23 16:57:23 · 304 阅读 · 0 评论 -
python库(14):Arrow库简化时间处理
Arrow 是一个被称为程序员的时间处理利器的 Python 库。从诞生起,它就是为了填补 Python 的 datetime 类型的功能空白而生的。为程序员提供了一种更简单、更直观的方式来处理日期和时间。原创 2024-07-23 11:15:29 · 666 阅读 · 0 评论 -
python进阶(6):魔术方法篇(2)
_repr__是Python类中的一个特殊方法,全称为“representation”,即表示法。当你在交互式环境中直接输入一个对象的名称,或者使用repr()函数时,Python就会调用这个方法来返回一个字符串,该字符串旨在提供对象的“官方”表示形式,它应该是一段可读性强且尽可能明确地表示对象内容的代码片段,理论上,这个字符串应该是可以用来重新创建原始对象的。当我们打印my_book对象时,输出的是一个构造该对象的字符串,这正是__repr__所返回的内容。不使用__repr__方法时。原创 2024-07-17 14:55:43 · 338 阅读 · 0 评论 -
python基础篇(12):继承
类继承允许一个派生类(子类)继承一个或多个基类(父类)的方法和属性(不含私有)。上面代码中的pass是占位语句,用来保证函数(方法)或类定义的完整性,表示无内容,空的意思。注意:只可以在子类内部调用父类的同名成员,子类的实体类对象调用默认是调用子类复写的。多个父类中,如果有同名的成员,那么默认以继承顺序(从左到右)为优先级。一旦复写父类成员,那么类对象调用成员的时候,就会调用复写后的新成员。Python的类之间也支持多继承,即一个类,可以继承多个父类。即:先继承的保留,后继承的被覆盖。原创 2024-07-17 11:57:12 · 314 阅读 · 0 评论 -
python基础篇(11):封装
通俗理解:封装,简而言之,就是把数据(变量)和操作这些数据的方法(函数)打包在一起,形成一个“黑箱”,外界只能通过预设的接口(方法)来访问或修改这个“黑箱”里的内容,而无需知道其内部是如何工作的。专业术语:封装是面向对象编程(OOP)的四大基本原则之一,它通过隐藏对象的属性和实现细节,仅对外公开接口来控制外部对对象的访问。原创 2024-07-17 10:56:05 · 1210 阅读 · 0 评论 -
python库(13):Tablib库简化数据处理
数据处理是一个常见且重要的任务。无论是数据科学、机器学习,还是日常数据分析,都需要处理和管理大量的数据。然而,标准库中的工具有时显得不够直观和简便。这时,我们可以借助第三方库来简化数据处理流程。Tablib 就是这样一个强大的数据处理库,它提供了一套简单易用的 API 来处理各种数据格式。Tablib 主要用于处理表格数据,并且支持多种数据格式的导入和导出,包括 CSV、Excel、JSON、YAML 等。Tablib 的核心是 Dataset 对象,它类似于一个电子表格,包含行和列的结构化数据。原创 2024-07-13 00:44:17 · 583 阅读 · 0 评论 -
python库(12):Requests库实现HTTP请求
虽然还有其他HTTP库,但Requests库以其简洁的API和人性化的设计脱颖而出。它隐藏了HTTP协议的复杂性,让开发者可以专注于业务逻辑,而不是底层的网络细节。此外,Requests库支持Python 2.7和3.4+版本,这使得它能够覆盖广泛的用户群体。Requests是一个极为流行的HTTP库,它允许你发送各种类型的HTTP请求。Requests库还支持会话(Session)的使用,这可以帮助你维持某些参数和Cookies跨越多个请求。在发送请求时,可能会遇到各种网络问题或其他异常。原创 2024-07-12 14:48:18 · 440 阅读 · 0 评论 -
python库(11):Box库简化字典和对象之间的转换
Box是一个Python库,它提供了一种将数据封装在字典和列表中的方式,同时提供了一些额外的功能,比如数据验证、默认值设置等。这使得Box库非常适合用于配置管理、数据传输对象(DTO)的创建,以及任何需要将数据结构化的场景。原创 2024-07-12 13:19:45 · 428 阅读 · 0 评论 -
python库(10):SpaCy库实现NLP处理
自然语言处理(NLP)是人工智能领域中一个重要的分支。它旨在使计算机能够理解、解释和生成人类语言。Python中的SpaCy库提供了丰富的功能和工具,SpaCy是一个开源的软件库,用于处理和操作自然语言文本,可以帮助我们轻松进行各种NLP任务。相比于其他NLP库,SpaCy的特点在于其高效性和易用性。它专为处理大规模文本数据而设计,拥有快速的管道处理能力,使得它在实际项目中非常实用。原创 2024-07-11 16:30:41 · 853 阅读 · 0 评论 -
python进阶(5):魔术方法篇(1)
之前使用的__init__ 构造方法,是Python类内置的方法之一。这些内置的类方法,各自有各自特殊的功能,这些内置方法我们称之为:魔术方法。原创 2024-07-11 15:21:25 · 436 阅读 · 0 评论 -
python基础篇(10):类、对象与构造方法
1.1 类使用语法 class是关键字,表示要定义类了 类的属性,即定义在类中的变量(成员变量) 类的行为,即定义在类中的函数(成员方法)1.2 创建类对象的语法1.3 成员变量和成员方法定义成员变量和方法使用成员变量和成员方法可以看出,类中:其中:1.4 成员方法的定义语法在类中定义成员方法和定义函数基本一致,但仍有细微区别:可以看到,在方法定义的参数列表中,有一个:self关键字self关键字是成员方法定义的时候,必须填写的。注意:self关键字,尽管在参原创 2024-07-11 11:18:54 · 257 阅读 · 0 评论 -
python库(9):prettytable库快速实现ASCII表格
下面介绍一个快速制作ASCII表格库——prettytable,可以方便地制作简单表格。原创 2024-07-10 11:48:38 · 344 阅读 · 0 评论 -
python库(8):re库实现字符串处理
Python 的re库是一个功能强大的正则表达式模块,它允许用户执行各种复杂的字符串匹配和处理任务。搜索:re.search() 用于搜索字符串中第一次出现的模式。匹配:re.match() 从字符串的开始位置匹配模式。查找:re.findall() 返回字符串中所有匹配的子串。分组:使用圆括号定义的分组,可以在搜索结果中单独提取。替换:re.sub() 用于替换字符串中的匹配项。分割:re.split() 根据模式分割字符串。原创 2024-07-09 10:42:47 · 485 阅读 · 0 评论 -
python基础篇(10):自定义包
从物理上看,包就是一个文件夹,在该文件夹下包含了一个 __init__.py 文件,该文件夹可用于包含多个模块文件,从逻辑上看,包的本质依然是模块包的作用:当我们的模块文件越来越多时,包可以帮助我们管理这些模块, 包的作用就是包含多个模块,但包的本质依然是模块。原创 2024-07-08 23:03:29 · 602 阅读 · 0 评论 -
python基础篇(9):模块
Python 模块(Module),是一个 Python 文件,以 .py 结尾. 模块能定义函数,类和变量,模块里也能包含可执行的代码.模块的作用: python中有很多各种不同的模块, 每一个模块都可以帮助我们快速的实现一些功能, 比如实现和时间相关的功能就可以使用time模块,我们可以认为一个模块就是一个工具包, 每一个工具包中都有各种不同的工具供我们使用进而实现各种不同的功能.简而言之,模块就是一个Python文件,里面有类、函数、变量等,我们可以拿过来用(导入模块去使用)原创 2024-07-08 22:20:52 · 582 阅读 · 0 评论 -
python库(7):pymysql库实现mysql操作
在Python中,使用第三方库:pymysql 来完成对MySQL数据库的操作。原创 2024-07-08 16:27:54 · 242 阅读 · 0 评论 -
python基础篇(8):字符串常用处理汇总
使用center()方法将字符串居中对齐,并使用指定的字符填充两侧。使用upper()和lower()方法将字符串转换为大写或小写。使用ljust()方法将字符串左对齐,并使用指定的字符填充右侧。使用rjust()方法将字符串右对齐,并使用指定的字符填充左侧。使用replace()方法将字符串中的指定子串替换为新的子串。使用startswith()方法判断字符串是否以指定子串开头。使用capitalize()方法将字符串的首字母转换为大写。使用split()方法将字符串按照指定的分隔符进行分割。原创 2024-07-07 16:47:27 · 166 阅读 · 0 评论 -
python库(6):Pygments库
在软件开发和文档编写中,代码的可读性是至关重要的一环。无论是在博客文章、技术文档还是教程中,通过代码高亮可以使程序代码更加清晰和易于理解。而在Python世界中,Pygments库就是这样一个强大的工具,它能够将各种编程语言的代码转换为具有色彩区分的格式化输出。Pygments不仅支持基本的语法高亮,还允许用户通过自定义样式和输出格式来满足各种需求。例如,可以通过修改TerminalFormatter的参数来改变输出的颜色主题和显示格式。原创 2024-07-07 15:14:44 · 583 阅读 · 2 评论 -
python基础篇(8):异常处理
有时标准异常不足以描述特定的错误情况,可以通过创建自定义异常类来定义新的异常类型"""自定义异常类"""# 使用自定义异常try:print(ce)原创 2024-07-07 12:27:22 · 833 阅读 · 0 评论 -
python进阶(4):Python 脚本文件重启自身进程
现实环境中,正在运行的 Python 脚本程序需要在内部进行重新启动。这不是简单的关闭程序再运行,需要从程序内部重新运行该程序。原创 2024-07-06 16:01:33 · 498 阅读 · 0 评论 -
python库(5):Psutil库实现系统和硬件监控工具
psutil(process and system utilities)是一个跨平台库,用于检索运行中进程和系统利用率(包括 CPU、内存、磁盘、网络等)的信息,可以提供丰富的系统监控功能。原创 2024-07-06 02:15:47 · 917 阅读 · 0 评论 -
python库(4):jsondiff库
简单易用:提供简洁的 API,用于比较和处理 JSON 对象的差异。支持多种差异格式:支持合并差异、集合差异和文本差异等多种格式。高性能:采用高效的算法,能够快速处理大规模 JSON 数据的比较。可定制:允许用户自定义差异的格式和处理方式,满足不同应用场景的需求。与标准 JSON 兼容:生成的差异数据与标准 JSON 格式兼容,便于存储和传输。原创 2024-07-04 22:46:54 · 311 阅读 · 0 评论 -
python库(3):Cerberus库
Cerberus 是一个Python数据验证库,设计用于验证数据结构的有效性和一致性。它提供了一种简单而强大的方式来定义和应用验证规则,特别适用于处理用户输入的验证、配置文件的检查以及API的参数验证等场景。下面将详细介绍 Cerberus 的特点、使用方法以及一些示例。原创 2024-07-04 21:39:42 · 578 阅读 · 0 评论 -
python库(2):Passlib库
Passlib库就是一个强大的工具,专门用于密码的安全存储和验证。本文将介绍Passlib库的基本概念、功能和使用方法,帮助更好地理解和应用密码安全技术。Passlib是一个用于密码加密、哈希和验证的Python库,它提供了多种密码哈希算法和安全存储方法的实现。Passlib的设计目标是提供简单易用的API,同时保证密码的安全性,抵御常见的密码攻击如彩虹表攻击、暴力破解等。它支持的哈希算法包括但不限于SHA-256、SHA-512、bcrypt、PBKDF2等,这些算法都是经过广泛认可和安全验证的。原创 2024-07-04 17:35:58 · 518 阅读 · 0 评论 -
python库(1):Nuitka库
Nuitka是一个 Python 解释器的替代品,支持CPython提供的代码,可编译 Python 代码到 C++ 程序,并使用 libpython 来执行这些代码,就像 CPython 一样。这让你可以在没有安装 Python 的环境中运行 Python 程序,也可能提升执行效率。项目地址:https://github.com/Nuitka/Nuitka。原创 2024-07-03 17:26:10 · 664 阅读 · 0 评论 -
python进阶(3):文件操作
此时的`f`是`open`函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问,后续面向对象课程会给大家进行详细的介绍。readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下。文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被一直占用。如果该文件不存在,创建新文件。原创 2024-07-01 22:09:47 · 460 阅读 · 0 评论 -
python进阶(2):pyecharts使用
Echarts 是个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可. 而 Python 是门富有表达力的语言,很适合用于数据处理. 当数据分析遇上数据可视化时pyecharts 诞生了。原创 2024-07-01 15:12:08 · 281 阅读 · 0 评论 -
python进阶(1):json的使用
JSON是一种轻量级的数据交互格式。可以按照JSON指定的格式去组织和封装数据。JSON本质上是一个带有特定格式的字符串。主要功能:json就是一种在各个编程语言中流通的数据格式,负责不同编程语言中的数据传递和交互. 类似于:国际通用语言-英语中国56个民族不同地区的通用语言-普通话。原创 2024-07-01 11:19:38 · 287 阅读 · 0 评论 -
python基础篇(7):函数进阶知识点
缺省参数也叫默认参数,用于定义函数,为参数提供默认值,调用函数时可不传该默认参数的值(注意:所有位置参数必须出现在默认参数前,包括函数定义和调用).传进的所有参数都会被args变量收集,它会根据传进参数的位置合并为一个元组(tuple),args是元组类型,这就是位置传递。参数是“键=值”形式的形式的情况下, 所有的“键=值”都会被kwargs接受, 同时会根据“键=值”组成字典.注意:函数调用时,如果有位置参数时,位置参数必须在关键字参数的前面,但关键字参数之间不存在先后顺序。原创 2024-06-26 10:19:50 · 252 阅读 · 0 评论