数据挖掘 python库_那些被低估了的 Python 库

在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。

那些被低估的Python库

混合派

Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。

tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。

Colorama:简单的跨平台彩色终端文本。

pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。

Pandas-flavor:扩展pandas DataFrame/Series的简单方法。

More-Itertools:增加了类似于itertools的额外功能。

streamlit:为机器学习项目创建应用程序的简单方法。

数据清理和操作

ftfy:修复mojibake和Unicode文本中的其他故障。

janitor:有很多很酷的功能来清理数据。

Optimus:另一个数据清理包。

Great-experctations:一个检查数据是否符合预期的好工具。

那些被低估的Python库

数据探索和建模

Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。

dabl:允许使用可视化和预处理进行数据探索。

pydqc:允许比较两个数据集之间的统计数据。

pandas-summary:对panda DataFrames描述功能的扩展。

pivottable-js:pands在jupyter notebook的拖放功能。

数据结构

Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。

Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。

datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。

ranges:Python的连续范围、范围集和范围令数据结构

那些被低估的Python库

性能检查和优化

Py-spy: Python程序的采样分析器。

pyperf:用于运行Python基准测试的工具箱。

snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。

Cachier: Python函数的持久、无延迟、本地和跨机缓存。

Faiss:用于高效的相似性搜索和密集向量聚类的库。

原文:https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270

另外,再送大家一份《简明Python教程》

本书旨在于介绍如何使用 Python 语言进行编程的自由图书。它以教材与指南的形式为入门者介绍 Python 语言。

一句话介绍:Python 初学者的极佳教材。

在线手册:

https://wizardforcel.gitbooks.io/a-byte-of-python/content/

书籍短评

我所遇见的最好的事就是发现了《简明 Python 教程》,它确实是一本为新手准备的绝佳书籍。它撰写出色,清楚解释了诸多定义,并都配以了清晰的案例。-- Joshua Robin

这本书是我所见过的最好的新手教程!感谢你所做的努力。——Walt Michalik

我本应开始我实际的“工作”,但我却恰巧发现了这本《简明 Python 教程》。一本附有优秀例子的杰出教材。-- Biologist John

按照下面的步骤领取电子书吧

领取方式:

长按扫码,发消息[python]

长按扫码关注

回复发消息python

(注意:限 1天内免费!)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值