100个相见恨晚的Python库(建议收藏),Python高级面试题汇总

  • bleach:一个基于白名单的 HTML 清理和文本链接库。

  • cssutils:一个 Python 的 CSS 库。

  • html5lib:一个兼容标准的 HTML 文档和片段解析及序列化库。

  • lxml:一个非常快速,简单易用,功能齐全的库,用来处理 HTML 和 XML。

  • MarkupSafe:为 Python 实现 XML/HTML/XHTML 标记安全字符串。

  • pyquery:一个解析 HTML 的库,类似 jQuery。

  • requests-html:人性化的,Pythonic 的 HTML 解析库。

  • untangle:将 XML 文档转换为 Python 对象,使其可以方便的访问。

  • xhtml2pdf:HTML/CSS 转 PDF 工具。

  • xmltodict:像处理 JSON 一样处理 XML。

  • WeasyPrint:用于HTML和CSS的可视化呈现引擎,并可以导出为 PDF。

  • xmldataset:简单 XML 解析。

爬取网络站点的库

  • Scrapy:一个快速高级的屏幕爬取及网页采集框架。

  • ScrapydWeb:一个用于 Scrapyd 集群管理的全功能 web UI,支持 Scrapy 日志分析和可视化,自动打包,定时器任务和邮件通知等特色功能。

  • cola:一个分布式爬虫框架。

  • Demiurge:基于 PyQuery 的爬虫微型框架。

  • feedparser:通用 feed 解析器。

  • Grab:站点爬取框架。

  • MechanicalSoup:用于自动和网络站点交互的 Python 库。

  • portia:Scrapy 可视化爬取。

  • pyspider:一个强大的爬虫系统。

  • RoboBrowser:一个简单的,Python 风格的库,用来浏览网站,而不需要一个独立安装的浏览器。

41网页内容提取


用于进行网页内容提取的库。

  • Haul:一个可以扩展的图像爬取工具。

  • html2text:将 HTML 转换为 Markdown 格式文本。

  • lassie:人性化的网页内容检索库。

  • micawber:一个小型网页内容提取库,用来从 URLs 提取富内容。

  • newspaper:使用 Python 进行新闻提取,文章提取以及内容策展。

  • opengraph:一个用来解析开放内容协议(Open Graph Protocol)的 Python 模块。

  • python-goose:HTML 内容/文章提取器(python2)。

  • goose3:HTML 内容/文章提取器(python3)。

  • python-readability:arc90 公司 readability 工具的 Python 高速端口。

  • sanitize:为杂乱的数据世界带来调理性。

  • sumy:一个为文本文件和 HTML 页面进行自动摘要的模块。

  • textract:从任何格式的文档中提取文本,Word,PowerPoint,PDFs 等等。

42表单


进行表单操作的库。

  • Deform:Python HTML 表单生成库,受到了 formish 表单生成库的启发。

  • django-bootstrap3:集成了 Bootstrap 3 的 Django。

  • django-bootstrap4:集成了 Bootstrap 4 的 Django。

  • django-crispy-forms:一个 Django 应用,他可以让你以一种非常优雅且 DRY (Don’t repeat yourself) 的方式来创建美观的表单。

  • django-remote-forms:一个平台独立的 Django 表单序列化工具。

  • WTForms:一个灵活的表单验证和呈现库。

  • WTForms-JSON:一个 WTForms 扩展,用来处理 JSON 数据。

43数据验证


数据验证库。多用于表单验证。

  • Cerberus:一个映射验证器(mappings-validator)。支持多种规则,提供归一化功能,可以方便地定制为 Python 风格的 schema 定义。

  • colander:一个用于对从 XML, JSON,HTML 表单获取的数据或其他同样简单的序列化数据进行验证和反序列化的系统。

  • kmatch:一种用于匹配/验证/筛选 Python 字典的语言。

  • schema:一个用于对 Python 数据结构进行验证的库。

  • Schematics:数据结构验证。

  • valideer:轻量级可扩展的数据验证和适配库。

  • voluptuous:一个 Python 数据验证库。主要是为了验证传入 Python 的 JSON,YAML 等数据。

  • jsonschema:JSON Schema 的 python 实现,用于 JSON 数据的验证。

44序列化


复杂数据类型序列化相关库。

  • marshmallow:一个轻量级的库,用于将复杂对象与简单 Python 数据类型相互转换。

  • pysimdjson:与 Python 绑定的 simdjson 。

  • python-rapidjson:RapidJSON 的 Python 封装。

  • ultrajson:使用 Python 绑定的,用 C 编写的快速 JSON 解码器和编码器。

45反垃圾技术


帮助你和电子垃圾进行战斗的库。

  • django-simple-captcha:一个简单、高度可定制的 Django 应用,可以为任何 Django 表单添加验证码。

  • django-simple-spam-blocker:一个用于 Django 的简单的电子垃圾屏蔽工具。

46标记


用来进行标记的库。

  • django-taggit:简单的 Django 标记工具。

47管理面板


管理界面库。

  • Ajenti:一个你的服务器值得拥有的管理面板。

  • django-suit:Django 管理界面的一个替代品(仅对于非商业用途是免费的)。

  • django-xadmin:Django admin 的一个替代品,具有很多不错的功能。

  • flask-admin:一个用于 Flask 的简单可扩展的管理界面框架。

  • flower:一个对 Celery 集群进行实时监控和提供 web 管理界面的工具。

  • Grappelli:Django 管理界面的一个漂亮的皮肤。

  • Wooey:一个 Django 应用,可以为 Python 脚本创建 web 用户界面。

  • django-grappelli:拥有绚丽外观的 Django Admin 界面。

  • django-jet:具有改进功能的现代响应式 Django 管理界面模板。

  • jet-bridge:管理面板框架,适用于任何具有良好 UI 的应用(例如 Django)。

48Serverless 框架


使用 Python 开发 Serverless 模型相关的库。

  • python-lambda :在 AWS Lambda 开发和部署 Python 代码的工具包。

  • Zappa:在 AWS Lambda 和 API Gateway 部署 WSGI 应用的工具。

49静态站点生成器


静态站点生成器是一个软件,它把文本和模板作为输入,然后输出 HTML 文件。

  • Pelican:使用 Markdown 或 ReST 来处理内容, Jinja 2 来制作主题。支持 DVCS, Disqus.。AGPL 许可。

  • Cactus:为设计师设计的静态站点生成器。

  • Hyde:基于 Jinja2 的静态站点生成器。

  • Nikola:一个静态网站和博客生成器。

  • Tinkerer:Tinkerer 是一个博客引擎/静态站点生成器,由 Sphinx 驱动。

  • Lektor:一个简单易用的静态 CMS 和博客引擎。

  • makesite:简单轻量的站点/博客生成器(小于 130 行代码)。

50进程


操作系统进程启动及通信库。

  • envoy:比 Python subprocess 模块更人性化。

  • sarge:另一 种 subprocess 模块的封装。

  • sh:一个完备的 subprocess 替代库。

  • delegator.py:人性化的 Subprocesses 2.0 版本。

51并发和并行


用以进行并发和并行操作的库。

  • multiprocessing:(Python 标准库) 基于进程的“线程”接口。

  • threading:(Python 标准库)更高层的线程接口。

  • eventlet:支持 WSGI 的异步框架。

  • gevent:一个基于协程的 Python 网络库,使用 greenlet。

  • Tomorrow:用于产生异步代码的神奇的装饰器语法实现。

  • uvloop:在 libuv 之上超快速实现 asyncio 事件循环。

  • concurrent.futures:(Python 标准库) 异步执行可调用对象的高级接口。

  • gevent:使用 greenlet 且基于协程的 Python 网络库。

  • scoop:支持在 Python 中进行可伸缩并行操作。

52网络


用于网络编程的库。

  • asyncio:(Python 标准库) 异步 I/O,事件循环,协程以及任务。

  • trio:异步并发和 I/O 友好的库。

  • Twisted:一个事件驱动的网络引擎。

  • pulsar:事件驱动的并发框架。

  • diesel:基于 Greenlet 的事件 I/O 框架。

  • pyzmq:一个 ZeroMQ 消息库的 Python 封装。

  • Toapi:一个轻巧,简单,快速的 Flask 库,致力于为所有网站提供 API 服务。

  • txZMQ:基于 Twisted 的 ZeroMQ 消息库的 Python 封装。

53WebSocket


帮助使用 WebSocket 的库。

  • AutobahnPython:给 Python、使用的 WebSocket & WAMP 基于 Twisted 和 asyncio。

  • Crossbar:开源统一应用路由(Websocket & WAMP for Python on Autobahn)。

  • django-socketio:给 Django 用的 WebSockets。

  • WebSocket-for-Python:为 Python2/3 以及 PyPy 编写的 WebSocket 客户端和服务器库。

54WSGI 服务器


兼容 WSGI 的 web 服务器

  • gunicorn:Pre-forked, 部分是由 C 语言编写的。

  • uwsgi:uwsgi 项目的目的是开发一组全栈工具,用来建立托管服务,由 C 语言编写。

  • bjoern:异步,非常快速,由 C 语言编写。

  • fapws3:异步 (仅对于网络端),由 C 语言编写。

  • meinheld:异步,部分是由 C 语言编写的。

  • netius:异步,非常快速。

  • paste:多线程,稳定,久经考验。

  • rocket:多线程。

  • waitress:多线程,是它驱动着 Pyramid 框架。

  • Werkzeug:一个 WSGI 工具库,驱动着 Flask,而且可以很方便大嵌入到你的项目中去。

55ASGI 服务器


兼容 ASGI 的 web 服务器。

  • daphne:用于 ASGI 和 ASGI-HTTP 的,支持 HTTP,HTTP2 和 WebSocket 协议的服务器。

  • uvicorn:使用 uvloop 和 httptools 实现的闪电般快速的 ASGI 服务器。

56RPC 服务器


兼容 RPC 的服务器。

  • SimpleJSONRPCServer:这个库是 JSON-RPC 规范的一个实现。

  • SimpleXMLRPCServer:(Python 标准库) 简单的 XML-RPC 服务器实现,单线程。

  • zeroRPC:zerorpc 是一个灵活的 RPC 实现,基于 ZeroMQ 和 MessagePack。

  • RPyC (Remote Python Call):适用于 Python 的透明且对称的RPC库。

57密码学


  • cryptography:这个软件包意在提供密码学基本内容和方法提供给 Python 开发者。

  • hashids:在 Python 中实现 hashids 。

  • Paramiko:SSHv2 协议的 Python (2.6+, 3.3+) ,提供客户端和服务端的功能。

  • Passlib:安全密码存储/哈希库。

  • PyCrypto:Python 密码学工具箱。

  • PyNacl:网络和密码学(NaCl) 库的 Python 绑定。

58图形用户界面


用来创建图形用户界面程序的库。

  • curses:内建的 ncurses 封装,用来创建终端图形用户界面。

  • enaml:使用类似 QML 的 Declaratic 语法来创建美观的用户界面。

  • kivy:一个用来创建自然用户交互(NUI)应用程序的库,可以运行在 Windows, Linux, Mac OS X, Android 以及 iOS 平台上。

  • pyglet:一个 Python 的跨平台窗口及多媒体库。

  • PyQt:跨平台用户界面框架 Qt 的 Python 绑定 ,支持 Qt v4 和 Qt v5。

  • PySide:跨平台用户界面框架 Qt 的 Python 绑定 ,支持 Qt v4。

  • Tkinter:Tkinter 是 Python GUI 的一个事实标准库。

  • Toga:一个 Python 原生的,操作系统原生的 GUI 工具包。

  • urwid:一个用来创建终端 GUI 应用的库,支持组件,事件和丰富的色彩等。

  • wxPython:wxPython 是 wxWidgets C++ 类库和 Python 语言混合的产物。

  • PyGObject:GLib/GObject/GIO/GTK+ (GTK+3) 的 Python 绑定。

  • Flexx:Flexx 是一个纯 Python 语言编写的用来创建 GUI 程序的工具集,它使用 web 技术进行界面的展示。

  • Eel:用于制作简单离线 HTML/JS GUI 应用的库。

  • PySimpleGUI:tkinter,Qt,WxPython 和 Remi 的封装。

  • pywebview:围绕网页视图组件的轻量级跨平台的原生包装。

  • DearPyGui:一个简单的可使用 GPU 加速的 Python GUI 框架。

59游戏开发


超赞的游戏开发库。

  • Cocos2d:cocos2d 是一个用来开发 2D 游戏, 示例和其他图形/交互应用的框架。基于 pyglet。

  • Panda3D:由迪士尼开发的 3D 游戏引擎,并由卡内基梅陇娱乐技术中心负责维护。使用 C++ 编写, 针对 Python 进行了完全的封装。

  • Pygame:Pygame 是一组 Python 模块,用来编写游戏。

  • PyOgre:Ogre 3D 渲染引擎的 Python 绑定,可以用来开发游戏和仿真程序等任何 3D 应用。

  • PyOpenGL:OpenGL 的 Python 绑定及其相关 APIs。

  • PySDL2:SDL2 库的封装,基于 ctypes。

  • RenPy:一个视觉小说(visual novel)引擎。

  • Arcade:一个现代 Python 框架,用于制作具有引人入胜的图形与声音的游戏。

  • Harfang3D:支持3D,VR 与游戏开发的 Python 框架。

60日志


用来生成和操作日志的库。

  • logging:(Python 标准库) 为 Python 提供日志功能。

  • logbook:Logging 库的替代品。

  • Eliot:为复杂的和分布式系统创建日志。

  • Raven:Sentry 的 Python 客户端。

  • Sentry:实时记录和收集日志的服务器。

  • sentry-python:Python 版 Sentry SDK。

  • loguru:旨在带来愉悦体验的 Python 日志库。

  • structlog:结构化日志,让日志变得简单。

61测试


进行代码库测试和生成测试数据的库。

  • 测试框架

    • unittest:(Python 标准库) 单元测试框架。
  • nose:nose 扩展了 unittest 的功能。

  • nose2 nose的继任者,基于 unittest2

  • contexts:一个 Python 3.3+ 的 BDD 框架。受到 C# Machine.Specifications 的启发。

  • hypothesis:Hypothesis 是一个基于先进的 Quickcheck 风格特性的测试库。

  • mamba:Python 的终极测试工具, 拥护 BDD。

  • pyshould:Should 风格的断言,基于 PyHamcrest。

  • pytest:一个成熟的全功能 Python 测试工具。

  • green:干净,多彩的测试工具。

  • pyvows:BDD 风格的测试工具,受 Vows.js 的启发。

  • Robot Framework:一个通用的自动化测试框架。

  • tox:自动化测试与发布的工具,支持多个 Python 版本。

  • GUI / Web 测试

    • Selenium:Selenium WebDriver 的 Python 绑定。
  • PyAutoGUI:PyAutoGUI 是一个人性化的跨平台 GUI 自动测试模块。

  • locust:使用 Python 编写的,可扩展的用户加载测试工具。

  • sixpack:一个和语言无关的 A/B 测试框架。

  • splinter:开源的 web 应用测试工具。

  • Schemathesis:基于属性的自动测试工具,用于测试使用 Open API / Swagger 规范构建的 Web 应用程序。

  • Mock 测试

    • mock:(Python 标准库) 一个用于伪造测试的库。
  • doublex:Python 的一个功能强大的 doubles 测试框架。

  • freezegun:通过伪造日期模块来生成不同的时间。

  • httmock:针对 Python 2.6+ 和 3.2+ 生成 伪造请求的库。

  • httpretty:Python 的 HTTP 请求 mock 工具。

  • responses:伪造 Python 中的 requests 库的一个通用库。

  • VCR.py:在你的测试中记录和重放 HTTP 交互。

  • mocket:gevent/asyncio/SSL 支持的 socket mock 框架。

  • 对象工厂

    • factoryboy:一个 Python 用的测试固件 (test fixtures) 替代库。
  • mixer:另外一个测试固件 (test fixtures) 替代库,支持 Django, Flask, SQLAlchemy, Peewee 等。

  • modelmommy:为 Django 测试创建随机固件。

  • 代码覆盖率

    • coverage:代码覆盖率测量。
  • Codecov:一个代码覆盖率测试工具,为开源项目提供免费代码覆盖率测试服务。

  • 伪数据

    • faker:一个 Python 库,用来生成伪数据。
  • fake2db:伪数据库生成器。

  • mimesis:一个帮助你生成伪数据的 Python 库。

  • radar:生成随机的日期/时间。

  • 错误处理

    • FuckIt.py:使用最先进的技术来保证你的 Python 代码无论对错都能继续运行。

62渗透测试


渗透测试相关框架和工具。

  • fsociety:一款渗透测试框架。

  • setoolkit:社会工程工具包。

  • sqlmap:自动 SQL 注入和数据库接管工具。

63代码分析和 Lint 工具


进行代码分析、解析和操作代码库的库和工具。

  • 代码分析

    • coala:语言独立和易于扩展的代码分析应用程序。
  • code2flow:把你的 Python 和 JavaScript 代码转换为流程图。

  • pycallgraph:这个库可以把你的 Python 应用的流程(调用图)进行可视化。

  • pysonar2:Python 类型推断和检索工具。

  • prospector:分析 Python 代码的工具。

  • vulture:用于发现和分析无效 Python 代码的工具。

  • Lint 工具

    • awesome-flake8-extensions
  • Flake8:模块化源码检查工具,提供与 pycodestylepyflakes 、McCabe 相关的装饰器。

  • Pylint:一个完全可定制的源码分析器。

  • YAPF:Google 的 Python 代码格式化工具。

  • pylama:Python 和 JavaScript 的代码审查工具。

  • wemake-python-styleguide:有史以来最严格的 Python 代码审查工具。

  • 代码格式化

    • autopep8:自动格式化 Python 代码,以使其符合 PEP8 规范。
  • black:一个坚定的 Python 代码格式化工具。

  • isort:用于纠正包导入顺序的 Python 库。

  • 静态类型检查,也可以参考 awesome-python-typing

    • mypy:在编译期间检查变量类型。
  • pyre-check:性能类型检查。

  • typeshed:带有静态类型的Python库存根的集合。

  • 静态类型注释生成器

    • MonkeyType:通过收集运行时的类型来为 Python 生成静态类型注释的系统。
  • pyannotate:自动生成符合 PEP-484 的注解。

  • pytype:检查和推断 Python 代码中的类型,无需添加注解。

64调试工具


用来进行代码调试的库。

  • 调试器

    • ipdb:IPython 启用的 pdb。
  • pudb:全屏,基于控制台的 Python 调试器。

  • pdb++:另一种 pdb 的替代。

  • pyringe:可以在 Python 进程中附加和注入代码的调试器。

  • wdb:一个奇异的 web 调试器,通过 WebSockets 工作。

  • winpdb:一个具有图形用户界面的 Python 调试器,可以进行远程调试,基于 rpdb2。

  • 追踪器

  • lptrace:为 Python 程序打造的 strace。

  • manhole:调试UNIX套接字连接,并显示所有线程的堆栈跟踪和交互式提示。

  • pyringe:能够附加到 Python 进程并将代码注入Python进程的调试器。

  • python-hunter:一个灵活的代码追踪工具包。

  • 性能分析器

  • lineprofiler:逐行性能分析。

  • Memory Profiler、内存:监控 Python 代码的内存使用。

  • profiling:一个交互式 Python 性能分析工具。

  • py-spy:Python 程序采样分析器,使用 Rust 实现。

  • pyflame:用于 Python 的跟踪分析器。

  • vprof:视觉 Python 分析器。

  • 其他

  • pyelftools:解析和分析 ELF 文件以及 DWARF 调试信息。

  • python-statsd:statsd 服务器的 Python 客户端。

  • django-debug-toolbar:为 Django 显示各种调试信息。

  • django-devserver:一个 Django 运行服务器的替代品。

  • flask-debugtoolbar:django-debug-toolbar 的 flask 版。

  • icecream:通过一个简单的函数调用检查变量、表达式和程序执行情况。

65科学计算和数据分析


用来进行科学计算和数据分析的库。

  • astropy:一个天文学 Python 库。

  • bcbio-nextgen:这个工具箱为全自动高通量测序分析提供符合最佳实践的处理流程。

  • bccb:生物分析相关代码集合。

  • Biopython:Biopython 是一组可以免费使用的用来进行生物计算的工具。

  • blaze:NumPy 和 Pandas 的大数据接口。

  • cclib:一个用来解析和解释计算化学软件包输出结果的库。

  • NetworkX:一个为复杂网络设计的高性能软件。

  • Neupy:执行和测试各种不同的人工神经网络算法。

  • NumPy:使用 Python 进行科学计算的基础包。

  • Open Babel:一个化学工具箱,用来描述多种化学数据。

  • Open Mining:使用 Python 挖掘商业情报 (BI) (Pandas web 接口)。

  • orange:通过可视化编程或 Python 脚本进行数据挖掘,数据可视化,分析和机器学习。

  • Pandas:提供高性能,易用的数据结构和数据分析工具。

  • PyDy:PyDy 是 Python Dynamics 的缩写,用来为动力学运动建模工作流程提供帮助, 基于 NumPy, SciPy, IPython 和 matplotlib。

  • PyMC:马尔科夫链蒙特卡洛采样工具。

  • RDKit:化学信息学和机器学习软件。

  • SciPy:由一些基于 Python ,用于数学,科学和工程的开源软件构成的生态系统。

  • statsmodels:统计建模和计量经济学。

  • SymPy:一个用于符号数学的 Python 库。

  • zipline:一个 Python 算法交易库。

  • Bayesian-belief-networks:优雅的贝叶斯理念网络框架。

  • AWS Data Wrangler:AWS 平台上使用的 Pandas。

  • Optimus:在使用 PySpark 时,让敏捷数据科学工作流程变得简单。

  • Colour:大量色彩理论转换和算法的实现。

  • Karate Club:用于图形结构化数据的无监督机器学习工具箱。

  • NIPY:神经影响学工具箱集合。

  • ObsPy:地震学 Python 工具箱。

  • QuTiP:Python 版 Quantum 工具箱。

  • SimPy:一个基于过程的离散事件模拟框架。

66数据可视化


进行数据可视化的库。参见:awesome-javascript。

  • matplotlib:一个 Python 2D 绘图库。

  • bokeh:用 Python 进行交互式 web 绘图。

  • ggplot:ggplot2 给 R 提供的 API 的 Python 版本。

  • plotly:协同 Python 和 matplotlib 工作的 web 绘图库。

  • pyecharts:基于百度 Echarts 的数据可视化库。

  • pygal:一个 Python SVG 图表创建工具。

  • pygraphviz:Graphviz 的 Python 接口。

  • PyQtGraph:交互式实时 2D/3D/ 图像绘制及科学/工程学组件。

  • SnakeViz:一个基于浏览器的 Python’s cProfile 模块输出结果查看工具。

  • vincent:把 Python 转换为 Vega 语法的转换工具。

  • VisPy:基于 OpenGL 的高性能科学可视化工具。

  • Altair:用于 Python 的声明式统计可视化库。

  • bqplot:Jupyter Notebook 的交互式绘图库。

  • Cartopy:具有 matplotlib 支持的 Python 制图库。

  • Dash:构建在 Flask、React 和 Plotly 之上,旨在用于分析 Web 应用程序。

  • awesome-dash

  • diagrams:用图表作为代码。

  • plotnine:基于ggplot2的Python图形语法。

  • PyGraphviz:Graphviz 的 Python 接口。

  • Seaborn:使用 Matplotlib 进行统计数据可视化。

67计算机视觉


计算机视觉相关库。

  • OpenCV:开源计算机视觉库。

  • pyocr:Tesseract 和 Cuneiform 的包装库。

  • pytesseract:Google Tesseract OCR 的另一包装库。

  • SimpleCV:一个用来创建计算机视觉应用的开源框架。

  • EasyOCR:支持40多种语言的即用型 OCR。

  • Face Recognition:简单的面部识别库。

  • Kornia:PyTorch 的开源差异化计算机视觉库。

  • tesserocr:另一个简单的,兼容 Pillow 的 tesseract-ocr API 装饰器,可用于 OCR。

68深度学习


神经网络和深度学习相关框架。也可以参考 awesome-deep-learning。

  • Caffe:一个 Caffe 的 python 接口。

  • Caffe2:一个轻量级的,模块化的,可扩展的深度学习框架。

  • keras:以 tensorflow/theano/CNTK 为后端的深度学习封装库,快速上手神经网络。

  • MXNet:一个高效和灵活的深度学习框架。

  • Pytorch:一个具有张量和动态神经网络,并有强大 GPU 加速能力的深度学习框架。

  • SerpentAI:游戏代理框架,可使用任意视频游戏作为深度学习沙箱。

  • Theano:一个快速数值计算库。

  • TensorFlow:谷歌开源的最受欢迎的深度学习框架。

  • skflow:一个 TensorFlow 的简化接口(模仿 scikit-learn)。

  • hebel:GPU 加速的深度学习库。

  • pydeep:Python 深度学习库。

69机器学习


机器学习相关库,也可以参考 awesome-machine-learning。

  • Crab:灵活、快速的推荐引擎。

  • NuPIC:智能计算 Numenta 平台。

  • pattern:Python 网络挖掘模块。

  • PyBrain:另一个 Python 机器学习库。

  • Pylearn2:一个基于 Theano 的机器学习库。

  • python-recsys:一个用来实现推荐系统的 Python 库。

  • scikit-learn:基于 SciPy 构建的机器学习 Python 模块。

  • vowpalporpoise:轻量级 Vowpal Wabbit 的 Python 封装。

  • gym:开发和比较强化学习算法的工具包。

  • H2O:开源快速可扩展的机器学习平台。

  • Metrics:机器学习的评估指标。

  • vowpal_porpoise:Python 版 Vowpal Wabbit 装饰器。

  • xgboost:可扩展,便携式和分布式梯度提升库。

  • MindsDB:MindsDB 是现有数据库的开源 AI 层,可让使用标准查询轻松地进行开发,训练和部署最新的机器学习模型。

70推荐系统


用于构建推荐系统的相关库。

  • annoy:对 C++/Python 实现的近似近邻算法进行了内存优化。

  • fastFM:Factorization Machine 相关库。

  • implicit:对隐式数据集进行协作过滤的快速 Python 实现。

  • libffm:Field-aware Factorization Machine (FFM) 相关库。

  • lightfm:很多流行的推荐算法的 Python 实现。

  • spotlight:使用 PyTorch 实现的深度推荐模型。

  • Surprise:用于构建和分析推荐系统的科学工具。

  • tensorrec:TensorFlow 的推荐引擎框架。

71分布式计算


分布式计算相关的框架和库。

  • dpark:Spark 的 Python 克隆版,一个类似 MapReduce 的框架。

  • dumbo:这个 Python 模块可以让人轻松的编写和运行 Hadoop 程序。

  • luigi:这个模块帮你构建批处理作业的复杂流水线。

  • mrjob:在 Hadoop 或 Amazon Web Services 上运行 MapReduce 任务。

  • dask:用于分析计算的灵活的并行计算库。

  • PySpark:Spark 的 Python API 。

  • Ray:一个用于并行和分布式 Python 的系统,它统一了机器学习生态系统。

  • faust:一个 Python 流处理库,核心思想来源 Kafka Streams。

  • streamparse:运行针对事实数据流的 Python 代码。集成了 Apache Storm。

  • mars:是基于张量的,用于进行大规模数据计算的统一计算框架。

72函数式编程


使用 Python 进行函数式编程。

  • CyToolz:Toolz 的 Cython 实现:高性能函数式工具。

  • fn.py:在 Python 中进行函数式编程:实现了一些享受函数式编程缺失的功能。

  • funcy:炫酷又实用的函数式工具。

  • Toolz:一组用于迭代器,函数和字典的函数式编程工具。

  • Coconut:为了简单、优雅、更 Pythonic 的函数式编程而构建的 Python 变体。

  • more-itertools:比 itertools 拥有更多的可迭代对象的操作方式。

  • returns:一个类型安全的单元、转换器与合成工具集合。

73第三方 API


用来访问第三方 API 的库。参见:List of Python API Wrappers and Libraries。

  • apache-libcloud:一个为各种云设计的 Python 库。

  • boto3:Amazon Web Services 的 Python 接口。

  • django-wordpress:Django 的 WordPress 模型与视图。

  • facebook-sdk:Facebook 平台的 Python SDK。

  • facepy:Facepy 让和 Facebook’s Graph API 的交互变得更容易。

  • gmail:Gmail 的 Python 接口。

  • google-api-python-client:Python 用的 Google APIs 客户端库。

  • gspread:Google 电子表格的 Python API。

  • twython:Twitter API 的封装。

74DevOps 工具


用于 DevOps 的软件和库。

  • Ansible:一个非常简单的 IT 自动化平台。

  • SaltStack:基础设施自动化和管理系统。

  • OpenStack:用于构建私有和公有云的开源软件。

  • Docker Compose:快速,分离的开发环境,使用 Docker。

  • Fabric:一个简单的,Python 风格的工具,用来进行远程执行和部署。

  • cuisine:为 Fabric 提供一系列高级函数。

  • Fabtools:一个用来编写超赞的 Fabric 文件的工具。

  • gitapi:Git 的纯 Python API。

  • hgapi:Mercurial 的纯 Python API。

  • honcho:Foreman 的 Python 克隆版,用来管理基于 Procfile 的应用。

  • pexpect:在一个伪终端中控制交互程序,就像 GNU expect 一样。

  • psutil:一个跨平台进程和系统工具模块。

  • supervisor:UNIX 的进程控制系统。

  • cloudinit:一个多分发包,用于处理云实例的早期初始化。

  • pyinfra:一个通用的 CLI 工具包和 python 库,用于自动化的基础设施。

  • honcho:Foreman 的 Python 克隆版,用于管理基于 Procfile 的应用。

  • BorgBackup:具有压缩和加密功能的重复数据删除存档器。

  • docker-compose:使用 Docker 的快速独立的开发环境。

75任务调度


任务调度库。

  • APScheduler:轻巧但强大的进程内任务调度,使你可以调度函数。

  • django-schedule:一个 Django 排程应用。

  • doit:一个任务执行和构建工具。

  • gunnery:分布式系统使用的多用途任务执行工具 ,具有 web 交互界面。

  • Joblib:一组为 Python 提供轻量级作业流水线的工具。

  • Plan:如有神助地编写 crontab 文件。

  • schedule:人性化的 Python 任务调度库。

  • Spiff:使用纯 Python 实现的强大的工作流引擎。

  • TaskFlow:一个可以让你方便执行任务的 Python 库,一致并且可靠。

  • Airflow :是一个工作流分配管理系统,通过有向非循环图的方式管理任务流程,设置任务依赖关系和时间调度。

  • Prefect:一个现代的工作流程编排框架,使构建、计划和监视健壮的数据管道变得容易。

76外来函数接口


使用外来函数接口的库。

  • cffi:用来调用 C 代码的外来函数接口。

  • ctypes:(Python 标准库) 用来调用 C 代码的外来函数接口。

  • PyCUDA:Nvidia CUDA API 的封装。

  • SWIG:简化的封装和接口生成器。

77重构


Python 重构相关库和工具。

  • Bicycle Repair Man:Python 的重构工具。

  • Bowler:适用于现代Python的安全代码重构。

  • Rope:一个 Python 的重构库。

78高性能


让 Python 更快的库。

  • Cython:优化的 Python 静态编译器。使用类型混合使 Python 编译成 C 或 C++ 模块来获得性能的极大提升。

  • CLPython:用 Common Lisp 编写的 Python 编程语言的实现。

  • Grumpy:编译器比解释器更强大的 cpython2.7 替代品(alpha)。

  • IronPython:用 C# 编写的 Python 编程语言的实现。

  • Jython:为 JVM 用 Java 编写的 Python 编程语言的实现。

  • MicroPython:精简高效的 Python 编程语言实现。

  • Pyjion:基于 CoreCLR 的 Python JIT。

  • Numba:Python JIT (just in time) 编译器,针对科学用的 Python ,由 Cython 和 NumPy 的开发者开发。

  • PeachPy:嵌入 Python 的 x86-64 汇编器。可以被用作 Python 内联的汇编器或者是独立的汇编器,用于 Windows,Linux,OS X,Native Client 或者 Go 。

  • PyPy:使用 Python 实现的 Python。解释器使用黑魔法加快 Python 运行速度且不需要加入额外的类型信息。

  • Pyston:使用 LLVM 和现代 JIT 技术构建的 Python 实现,目标是为了获得很好的性能。

  • Stackless Python:一个强化版的 Python。

79微软的 Windows 平台


在 Windows 平台上进行 Python 编程。

  • Python(x,y):面向科学应用的 Python 发行版,基于 Qt 和 Spyder。

  • pythonlibs:非官方的 Windows 平台 Python 扩展二进制包。

  • PythonNet:Python 与 .NET 公共语言运行库 (CLR)的集成。

  • PyWin32:针对 Windows 的 Python 扩展。

  • WinPython:Windows 7/8 系统下便携式开发环境。

80网络可视化和 SDN


用来进行网络可视化和 SDN(软件定义网络)的工具和库。

  • Mininet:一款流行的网络模拟器以及用 Python 编写的 API。

  • POX:一个针对基于 Python 的软件定义网络应用(例如 OpenFlow SDN 控制器)的开源开发平台。

  • Pyretic:火热的 SDN 编程语言中的一员,为网络交换机和模拟器提供强大的抽象能力。

  • SDX Platform:基于 SDN 的 IXP 实现,影响了 Mininet, POX 和 Pyretic。

  • NRU:一个基于组件的软件定义网络框架。

  • napalm:可跨供应商 API 来操纵网络设备。

81硬件


用来对硬件进行编程的库。

  • ino:操作 Arduino 的命令行工具。

  • Pyro:Python 机器人编程库。

  • PyUserInput:跨平台的,控制鼠标和键盘的模块。

  • scapy:一个非常棒的操作数据包的库。

  • wifi:一个 Python 库和命令行工具用来在 Linux 平台上操作 WiFi。

  • Pingo:Pingo 为类似 Raspberry Pi,pcDuino, Intel Galileo 等设备提供统一的 API 用以编程。

  • keyboard:在 Windows 和 Linux 上挂钩并模拟全局键盘事件。

  • mouse:在 Windows 和 Linux 上挂钩并模拟全局鼠标事件。

82兼容性


帮助从 Python 2 向 Python 3 迁移的库。

  • Python-Future:这就是 Python 2 和 Python 3 之间丢失的那个兼容性层。

  • Six:Python 2 和 3 的兼容性工具。

  • modernize:使 Python 代码更加现代化以便最终迁移到 Python 3。

83算法和设计模式


数据结构、算法和设计模式的 Python 实现。也可以参考 awesome-algorithms 。

  • 算法

  • algorithms:数据结构和算法的简单示例。

  • python-ds:用于面试的数据结构和算法的集合。

  • sortedcontainers:排序集合的快速的纯 Python 实现。

  • TheAlgorithms:所有算法的 Python 实现。

  • 设计模式

  • PyPattyrn:一个简单而有效的库,用于实现常见的设计模式。

  • python-patterns:一个 Python 设计模式集合。

  • transitions:轻量级的,面向对象的有限状态机实现。

84内置类的增强版实现


一些 Python 内置类的增强版实现库。

  • attrs:一个在类定义时可替换 __init__, __eq__, __repr__等方法的样板。

  • bidict:高效的 Pythonic 的双向映射数据结构和相关功能。

  • Box:具有高级点符号访问权限的 Python 字典。

  • dataclasses:(Python 标准库) 数据类。

  • DottedDict:提供一种使用点路径符号访问列表和字典的方法的库。

85机器人


机器人相关库。

  • PythonRobotics:各种具有可视化效果的机器人算法的汇总。

  • rospy:ROS (Robot Operating System) 库。

86聊天工具


聊天机器人开发相关的库。

  • errbot:实现 ChatOps 的最简单最受欢迎的聊天机器人。

87编辑器插件和 IDE


  • Emacs

  • elpy:Emacs Python 开发环境。

  • Sublime Text

  • anaconda:Anaconda 可将功能齐全的 Python 开发 IDE 转换为 Sublime Text 3。

  • SublimeJEDI:一个很棒的自动补全库 Jedi 的Sublime Text 插件。

  • Vim

  • jedi-vim:用于 Python 的 Jedi 自动补全库的 Vim 绑定。

  • python-mode:一个将 Vim 转换为 Python IDE 的多合一插件。

  • YouCompleteMe:包含 Jedi 补全的 Python 引擎。

  • Visual Studio

  • PTVS:Visual Studio Python 工具。

  • Visual Studio Code

文末有福利领取哦~

👉一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。img

👉二、Python必备开发工具

img
👉三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
img

👉 四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(文末领读者福利)
img

👉五、Python练习题

检查学习结果。
img

👉六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
img

img

👉因篇幅有限,仅展示部分资料,这份完整版的Python全套学习资料已经上传

小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
img

S (Robot Operating System) 库。

86聊天工具


聊天机器人开发相关的库。

  • errbot:实现 ChatOps 的最简单最受欢迎的聊天机器人。

87编辑器插件和 IDE


  • Emacs

  • elpy:Emacs Python 开发环境。

  • Sublime Text

  • anaconda:Anaconda 可将功能齐全的 Python 开发 IDE 转换为 Sublime Text 3。

  • SublimeJEDI:一个很棒的自动补全库 Jedi 的Sublime Text 插件。

  • Vim

  • jedi-vim:用于 Python 的 Jedi 自动补全库的 Vim 绑定。

  • python-mode:一个将 Vim 转换为 Python IDE 的多合一插件。

  • YouCompleteMe:包含 Jedi 补全的 Python 引擎。

  • Visual Studio

  • PTVS:Visual Studio Python 工具。

  • Visual Studio Code

文末有福利领取哦~

👉一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。img

👉二、Python必备开发工具

img
👉三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
img

👉 四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。(文末领读者福利)
img

👉五、Python练习题

检查学习结果。
img

👉六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
img

img

👉因篇幅有限,仅展示部分资料,这份完整版的Python全套学习资料已经上传

小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数初中级Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Python爬虫全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频

如果你觉得这些内容对你有帮助,可以添加下面V无偿领取!(备注:python)
[外链图片转存中…(img-8wNRcrCR-1710952019961)]

  • 11
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值