如何有效提升数据分析效率?相信这是所有数据分析工作者都想解决的问题。本文整理了五大Python技巧,分别是Pandas Profiling;使用 Cufflinks 和 Plotly 绘制 Pandas 数据;IPython 魔术命令;Jupyter 中的格式编排;Jupyter 快捷键。相信这些技巧能很好地帮助大家提高数据分析的效率,下面赶紧来看看吧!
1. Pandas Profiling
该工具效果明显。下图展示了调用 df.profile_report() 这一简单方法的结果:
使用该工具只需安装和导入 Pandas Profiling 包。
2. 使用 Cufflinks 和 Plotly 绘制 Pandas 数据
经验丰富的数据科学家或数据分析师大多对 matplotlib 和 pandas 很熟悉。也就是说,你只需调用 .plot() 方法,即可快速绘制简单的 pd.DataFrame 或 pd.Series。
这已经很好了,不过是否可以绘制一个交互式、可缩放、可扩展的全景图呢?是时候让 Cufflinks* *出马了!(Cufflinks 基于 Plotly 做了进一步的包装。)在环境中安装 Cufflinks,只需在终端中运行! pip install cufflinks --upgrade 即可。其他方法如 .scatter_matrix() 也可以提供非常棒的可视化结果。