1 说明:
=====
1.1 Vaex:一种具有超级字符串功能的DataFrame Python库。
1.2 一种更快、更安全、更方便的方法,可以使用几乎任意大小的数据进行数据研究分析,适合大数据,比如秒开100G。
1.3 与Pandas(Python生态系统中最受欢迎的DataFrame库)相比,四核笔记本电脑上的字符串操作速度提高了约30-100倍,而32核设备上的字符串操作速度提高了1000倍。
1.4 Vaex使用ApacheArrow数据结构和C++,几乎所有Pandas的字符串操作都受支持,并且内存使用率几乎为零,因为延迟计算是以块的形式完成的。
![f1a82ab52e8907d8668cc0a1f0b42bc4.png](https://img-blog.csdnimg.cn/img_convert/f1a82ab52e8907d8668cc0a1f0b42bc4.png)
2 准备:
=====
2.1 官网:
https://github.com/vaexio/vaex #每天都在更新和维护http://vaex.io/https://pypi.org/project/vaex/https://vaex.readthedocs.io/en/latest/
2.2 环境:
华为笔记本电脑、深度deepin-linux操作系统、谷歌浏览器、python3.8和微软vscode编辑