Python 常用库

这篇博客列举了一系列Python在信息技术领域的工具和库,包括爬虫如Requestium、BeautifulSoup,深度学习的Caffe2,文本处理如FlashText,Web框架如Sanic,数据库如MongoDB的PyMongo,邮件处理如Mailjet,以及CMS系统如Django-CMS等。此外,还提到了电子商务框架django-oscar和支付处理库如alipay。
摘要由CSDN通过智能技术生成

Requestium:爬取解析。是 Requests, Selenium 和 Parsel 的结合体。

Caffe2:深度学习的库,优势是它是由 Facebook 团队来维护

FlashText:文本搜索与替换。当关键词数量>500 的时候,FlashText 的搜索速度开始超过正则

Sanic:和 Flask 类似,但是测试中达到每秒 36000 次请求

psutil:是用来获取操作系统监控以及进程管理

BeautifulSoup:解析HTML的,特点就是好用,有人吐槽BeautifulSoup慢

utils:工具库?

awesome-spider:搜集了几乎所有可以爬取的中文网址,从知乎豆瓣到知网,抖音微博到QQ

Nyspider:国内爬虫

python-spider:国内网站爬虫

annie:视频爬虫 https://github.com/iawia002/annie

gym+universe:两个开源强化学习

python-docx – 读取,查询以及修改 Microsoft Word 2007/2008 docx 文件

PDFMiner – 一个用于从PDF文档中抽取信息的工具。

PyPDF2 – 一个可以分割,合并和转换 PDF 页面的库。

ReportLab – 快速创建富文本 PDF 文档。

Mistune – 快速并且功能齐全的纯 Python 实现的 Markdown 解析器。

Python-Markdown – John Gruber’s Markdown 的 Python 版实现。

NLTK – 一个先进的平台,用以构建处理人类语言数据的 Python 程序。

jieba – 中文分词工具。

langid.py – 独立的语言识别系统。

Pattern – Python 网络信息挖掘模块。

SnowNLP – 一个用来处理中文文本的库。

TextBlob – 为进行普通自然语言处理任务提供一致的 API。

TextGrocery – 一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。

MkDocs – 对 Markdown 友好的文档生成器。

you-get – 一个 YouTube/Youku/Niconico 视频下载器,使用 Python3 编写。

youtube-dl – 一个小巧的命令行程序,用来下载 YouTube 视频。

python-qrcode – 一个纯 Python 实现的二维码生成器。

scikit-image – 一个用于(科学)图像处理的 Python 库。

thumbor – 一个小型图像服务,具有剪裁,尺寸重设和翻转功能

pygram – 类似 Instagram 的图像滤镜

pyocr – Tesseract 和 Cuneiform 的一个封装(wrapper)。

pytesseract – Google Tesseract OCR 的另一个封装(wrapper)。

python-tesseract – Google Tesseract OCR 的一个包装类。

moviepy – 一个用来进行基于脚本的视频编辑模块,适用于多种格式,包括动图 GIFs。

TinyDB – 一个微型的,面向文档型数据库。

HappyBase – 一个为 Apache HBase 设计的,对开发者友好的库。

PyMongo – MongoDB 的官方 Python 客户端。

redis-py – Redis 的 Python 客户端。

hot-redis – 为 Redis 提供 Python 丰富的数据类型

redisco – 一个 Python 库,提供可以持续存在在 Redis 中的简单模型和容器。

内容管理系统

django-cms – 一个开源的,企业级 CMS,基于 Django。

djedi-cms – 一个轻量级但却非常强大的 Django CMS ,考虑到了插件,内联编辑以及性能。

FeinCMS – 基于 Django 构建的最先进的内容管理系统之一。

Kotti – 一个高级的,Python 范的 web 应用框架,基于 Pyramid 构建。

Mezzanine – 一个强大的,持续的,灵活的内容管理平台。

Opps – 一个为杂志,报纸网站以及大流量门户网站设计的 CMS 平台,基于 Django。

Plone – 一个构建于开源应用服务器 Zope 之上的 CMS。

Quokka – 灵活,可扩展的小型 CMS,基于 Flask 和 MongoDB。

Wagtail – 一个 Django 内容管理系统。

Widgy – 最新的 CMS 框架,基于 Django。

电子商务

django-oscar – 一个用于 Django 的开源的电子商务框架。

django-shop – 一个基于 Django 的店铺系统。

Cartridge – 一个基于 Mezzanine 构建的购物车应用。

shoop – 一个基于 Django 的开源电子商务平台。

alipay – 非官方的 Python 支付宝 API。

merchant – 一个可以接收来自多种支付平台支付的 Django 应用。

money – 货币类库with optional CLDR-backed locale-aware formatting and an extensible currency exchange solution.

python-currencies – 显示货币格式以及它的数值

django-allauth – Django 的验证应用。

django-oauth-toolkit – 为 Django 用户准备的 OAuth2。

django-oauth2-provider – 为 Django 应用提供 OAuth2 接入。

elasticsearch-py – Elasticsearch 的官方底层 Python 客户端。

elasticsearch-dsl-py -Elasticsearch 的官方高级 Python 客户端。

envelopes – 供人类使用的电子邮件库。

flanker – 一个 email 地址和 Mime 解析库。

imbox – Python IMAP 库

inbox.py – Python SMTP 服务器。

inbox – 一个开源电子邮件工具箱。

lamson – Python 风格的 SMTP 应用服务器。

mailjet – Mailjet API 实现,用来提供批量发送邮件,统计等功能。

marrow.mailer – 高性能可扩展邮件分发框架。

modoboa – 一个邮件托管和管理平台,具有现代的、简约的 Web UI。

pyzmail – 创建,发送和解析电子邮件。

Talon – Mailgun 库,用来抽取信息和签名。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值