这个库能让你的 Pandas数据框互动起来!真强

今天我们介绍的是一个神奇的库 -- ITables ,它是获得 MIT 许可的 Python 软件包,是一个可使用DataTables[1] JavaScript 库渲染 Python DataFrames 的交互式表格。刚刚发布的 ITables 2.0 增加了对 DataTables 扩展库的支持。

如何使用 ITables

可以使用 pip 或 conda 安装 ITables:

或者

ITables 本质上是DataTables[2] 的 Python 封装。我们已设法将其依赖性降至最低:ITables 仅需要IPythonpandasnumpy,如果在 Jupyter 中使用 Pandas,您必须已经拥有这些资源(如果希望将 ITables 与PolarsDataFrames 结合使用,请添加 polars 和pyarrow)。

要在笔记本中使用 ITables,请运行以下代码片段:

之后,每个 Pandas 或 Polars DataFrame 都将使用DataTables库显示。有了 DataTables,可以更轻松、更全面地访问数据。可以展开表格,浏览不同页面,对数据进行排序,甚至搜索数据,而无需返回 Python 提示符。

图片

(使用 ITables 展示 Pandas DataFrame)

要将特定表格渲染为交互式 DataTable,或将参数传递给 DataTable 构造函数,可以使用show函数:

DataTables 扩展

下载数据

有了 DataTables 的Buttons[3]扩展,下载数据就变得非常简单:

图片

(The Copy/CSV/Excel buttons)

级联搜索

SearchPanes[4]扩展可以对有重复值的列进行快速、直观的搜索:

图片

(SearchPanes 扩展)

搜索生成器

我觉得SearchBuilder[5]扩展非常有用。此外,我还喜欢设置预定义搜索并只显示我们想关注的数据集部分的选项。

图片

(SearchBuilder扩展)

下采样

最后我需要介绍一下 ITables 的下采样[6]机制。默认情况下,只显示估计大小不超过 64kB(不超过 200 列)的表格子集。可以通过

通过查看表格右下方的表格摘要,可以判断表格是否进行了向下采样。

向下采样时,只有一部分数据被传递到 DataTables,因此搜索或数据导出功能只能访问这部分数据集。

向下采样是 ITables 快速运行的关键。在将opt.maxBytes设置为大数值或0 之前,请三思而后行,这很有可能会冻结你的notebook 。显示 1G 的 DataFrame 至少会让notebook 变得同样大(由于数据已导出为 JSON,所以可能会更大),而且目前还不清楚浏览器是否支持。

参考资料

[1]DataTables: https://datatables.net/

[2]DataTables: https://datatables.net/

[3]Buttons: https://mwouts.github.io/itables/extensions.html#buttons

[4]SearchPanes: https://mwouts.github.io/itables/extensions.html#searchpanes

[5]SearchBuilder: https://mwouts.github.io/itables/extensions.html#searchbuilder

[6]下采样: https://mwouts.github.io/itables/downsampling.html

  • 18
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当你想在Github上创建一个人工智能项目时,以下是一些教程和资源,可以帮助你入门和进行开发: 1. 选择合适的编程语言:人工智能项目可以使用多种编程语言进行开发,如Python、Java、C++等。选择一种你熟悉或感兴趣的语言作为项目的主要开发语言。 2. 学习机器学习和深度学习基础:人工智能的核心是机器学习和深度学习。你可以通过在线教程、书籍或课程来学习这些基础知识,了解常见的机器学习算法和深度学习架。 3. 选择合适的机器学习架:根据你的项目需求和编程语言选择合适的机器学习架。常用的机器学习架包括TensorFlow、PyTorch、Scikit-learn等。 4. 学习使用机器学习库和工具:熟悉所选机器学习架的基本概念和使用方法,掌握常用的机器学习库和工具的操作,如数据处理库(NumPy、Pandas)、数据可视化库(Matplotlib、Seaborn)等。 5. 寻找开源项目和示例代码:在Github上搜索相关的开源项目和示例代码,可以借鉴他人的实现思路和代码结构,快速开始你的项目。 6. 创建Github仓库:按照之前提到的步骤,在Github上创建一个新的仓库作为你的人工智能项目的主页。 7. 编写项目文档:为你的项目编写文档,包括项目介绍、安装说明、使用方法、代码结构等。这样其他人可以更好地理解和使用你的项目。 8. 提交代码和文档:使用Git命令行或者Git客户端将你的代码和文档提交到Github仓库中,并定期进行更新和维护。 9. 与社区互动:在Github上积极与其他开发者和用户进行交流和互动,接受反馈和建议,参与讨论等。 10. 持续学习和改进:人工智能领域发展迅速,持续学习新的技术和算法,并不断改进你的项目。 以上是一些基本的教程和资源,希望能帮助你开始在Github上创建自己的人工智能项目。记得不断学习和实践,积极参与开源社区,与他人分享你的工作和经验。祝你成功!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值