Pandas
是 Python 中的一个数据分析库,是为了解决数据分析任务而创建的。
Pandas
提供了大量能使我们快速便捷地处理数据的函数和方法,它是使 Python 成为强大而高效的数据分析编程语言的重要因素之一。具体的
Pandas
使用方法可以查看官方文档:10 Minutes to pandas http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
由于 Python 语言的一些特点,
Pandas
在处理数据的时候只能使用单核,在大数据量的情况会出现处理较慢的情况,通过项目 「
modin
」只需简单的改动一行代码就能提升处理速度。
读取一个 700MB 的文件就会有几倍的加速效果。
Modin is a DataFrame designed for datasets from 1KB to 1TB+.
项目地址:
https://github.com/modin-project/modin
今天的推荐不知道大家喜欢吗?如果你喜欢,请在文章底部留言和点赞,以表示对我的支持,你们的留言和点赞是我持续更新的动力哦!
章鱼猫在此感谢大家的关注和支持。喜欢我,就赶紧关注我,给我点赞吧!
「GitHub精选」,每晚10:24准时为您推送
关注公众号:非著名程序员,对话框回复关键字 “1024”,免费领取 30 本经典编程书籍。