一、算法设计#
Python 的数据结构,算法和设计模式的实现。另请参阅真棒算法。
演算法
algorithms –数据结构和算法的最小示例。
python-ds- 用于采访采访的数据结构和算法的集合。
sortedcontainers- 排序集合的快速和纯 Python 实现。
TheAlgorithms- 用 Python 实现的所有算法。
设计模式
PyPattyrn- 一个简单但有效的库,用于实现常见的设计模式。
python-patterns -Python 中设计模式的集合。
transitions - 一种轻量级的,面向对象的有限状态机实现。
二、声音、视频、图像、文字处理
用于处理音频及其元数据的库。
声音的
- audioread- 跨库(GStreamer + 核心音频 + MAD + FFmpeg)音频解码。
- dejavu- 音频指纹识别。
- kapre - Keras 音频预处理器
- librosa- 用于音频和音乐分析的 Python 库
- matchering - 一个用于自动参考音频制作的库。
- mingus- 带有 MIDI 文件和播放支持的高级音乐理论和乐谱包。
- pyAudioAnalysis- 音频特征提取,分类,分段和应用。
- pydub- 使用简单易用的高级界面处理音频。
- TimeSide- 开放的 Web 音频处理框架。
Metadata
- beets- 音乐库管理器和 MusicBrainz 标记器。
- eyeD3- 一种用于处理音频文件的工具,特别是包含 ID3 元数据的 MP3 文件。
- mutagen- 处理音频元数据的 Python 模块。
- tinytag- 用于读取 MP3,OGG,FLAC 和 Wave 文件的音乐元数据的库。
用于处理视频和 GIF 的库。
- moviepy- 用于基于脚本的电影编辑的模块,具有多种格式,包括动画 GIF。
- scikit-video -SciPy 的视频处理例程。
- vidgear- 最强大的多线程视频处理框架。
用于处理图像的库。
- hmap- 图像直方图重新映射。
- imgSeek- 使用视觉相似性搜索图像集合的项目。
- nude.py- 裸露检测。
- pagan - 复古 identicon(阿凡达)根据输入的字符串和哈希生成。
- pillow- 枕头是友好的 PIL 叉。
- python- barcode - 在 Python 中创建条形码,没有任何额外的依赖关系。
- pygram- 类似 Instagram 的图像过滤器。
- PyMatting -Alpha 遮罩的库。
- python-qrcode- 一个纯 Python QR Code 生成器。
- pywal- 一种从图像生成配色方案的工具。
- pyvips- 具有低内存需求的快速图像处理库。
- Quads - 基于四叉树的计算机艺术。
- scikit-image- 用于(科学)图像处理的 Python 库。
- thumbor- 智能影像服务。它可以按需裁剪,调整图像大小和翻转图像。
- wand - MagickWand 的 Python 绑定,ImageMagick 的 C API。
用于解析和处理纯文本的库。
一般的
- chardet- 与 Python 2/3 兼容的字符编码检测器。
- difflib-(Python 标准库)用于计算增量的帮助程序。
- ftfy- 自动使 Unicode 文本更清晰,更一致。
- Fuzzywuzzy- 模糊字符串匹配。
- Levenshtein- 快速计算 Levenshtein 距离和字符串相似度。
- pangu.py- 偏执的文字间距。
- pyfiglet- 用 Python 编写的 figlet 的实现。
- pypinyin- 将汉字(Hanzi)转换为拼音(Pyyin)。
- textdistance- 使用 30 多种算法计算序列之间的距离。
- unidecode -Unicode 文本的 ASCII 音译。
Slugify
- awesome-slugify- 一个可以保留 unicode 的 Python slugify 库。
- python-slugify- 一个 Python slugify 库,它将 unicode 转换为 ASCII。
- unicode-slugify- 一种 Slugifier,它以 Django 为依赖项生成 unicode slug。
唯一标识符
- hashids- 在 Python 中实现 hashids。
- shortuuid- 简洁,明确和 URL 安全的 UUID 的生成器库。
解析器
- ply - 的 lex 和 yacc 解析工具的 Python 实现。
- pygments- 通用语法荧光笔。
- pyparsing- 生成解析器的通用框架。
- python-nameparser - 将人名解析为它们的各个组成部分。
- python-phonenumbers- 解析,格式化,存储和验证国际电话号码。
- python-user-agents- 浏览器用户代理解析器。
- sqlparse- 一个非验证的 SQL 解析器。
三、日期和时间
用于处理日期和时间的库。
- Arrow- 一个 Python 库,提供了一种明智且人性化的方法来创建,操作,格式化和转换日期,时间和时间戳。
- Chronyk- 一个 Python 3 库,用于解析人类编写的时间和日期。
- dateutil- 标准 Python datetime 模块的扩展。
- delorean- 一个库,用于清除与日期时间有关的不便的事实。
- maya- 人类的日期时间。
- moment - 一个 Python 库用于处理日期 / 时间。受到 Moment.js 的启发。
- Pendulum-Python 日期时间变得容易。
- PyTime- 一个易于使用的 Python 模块,旨在按字符串操作日期 / 时间 / 日期时间。
- pytz- 世界时区定义,现代和历史。将 tz 数据库带入 Python。
- when.py- 提供用户友好的功能来帮助执行常见的日期和时间操作。
四、爬虫
自动执行 Web 抓取。
- cola- 分布式抓取框架。
- feedparser- 通用供稿解析器。
- grab - 网站抓取框架。
- MechanicalSoup- 用于自动与网站进行交互的 Python 库。
- portia - Scrapy 的视觉抓取。
- pyspider- 强大的蜘蛛系统。
- robobrowser- 一个简单的 Pythonic 库,无需独立的 Web 浏览器即可浏览 Web。
- scrapy- 快速的高级屏幕抓取和网络爬网框架。
用于提取 Web 内容的库。
- html2text- 将 HTML 转换为 Markdown 格式的文本。
- lassie- 人类的 Web 内容检索。