1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源

334 篇文章 5 订阅
23 篇文章 4 订阅
Sweetviz是一个基于Python的数据分析工具,只需掌握3种函数,即可实现数据集的可视化和分析。通过analyze(),compare()和compare_intra()函数,用户可以轻松进行数据比较和分析。Sweetviz生成的报告直观易读,适合初学者和专业人士快速理解数据。
摘要由CSDN通过智能技术生成

你是否也在朋友圈看过这样的小广告:
在这里插入图片描述

「你要悄悄学Python,然后惊艳所有人。」

现在,GitHub上一位博主告诉你:不用学,用sweetviz就行。

这是一个基于Python编写的数据分析软件,只要掌握3种函数用法,一行Python代码就能实现数据集可视化、分析与比较

我们以Titanic数据集为例,输入一行代码:

img

一个1080p的清晰网页界面就出现在了眼前。
在这里插入图片描述
不仅根据性别、年龄等不同栏目纵向分析数据,每个栏目下还有众数、最大值、最小值等横向对比。

所有输入的数值、文本信息都会被自动检测,并进行数据分析、可视化和对比,最后帮你进行数据总结。

在这样的数据分析下,结果一目了然。
在这里插入图片描述

Titanic数据集部分功能细节展示

这样的效果,是基于3个主函数实现的。

3种函数用法

analyze()丨数据分析

在这里插入图片描述

数据分析函数中,有4个参数source,target_feat,feat_cfg和pairwise_analysis需要被设置。

source:以pandas中的DataFrame数据结构、或是DataFrame中的某一类字符串作为分析对象。

target_feat:需要被标记为目标对象的字符串。

feat_cfg:需要被跳过、或是需要被强制转换为某种数据类型的特征。

pairwise_analysis:相关性和其他类型的数据关联可能需要花费较长时间。如果超过了某个阈值,就需要设置这个参数为on或者off,以判断是否需要分析数据相关性。
在这里插入图片描述

数据相关性分析效果,可能需要花费一定时间

compare()丨两个数据集比较

img
如果想要对两个数据集进行对比分析,就使用这个比较函数。

例子中的my_dataframe和test_df是两个数据集,分别被命名为训练数据和测试数据。

除了这个被插入的数据集,剩余的参数与analyze中的一致。

compare_intra()丨数据集栏目比较

img
想要对数据集中某个栏目下的参数进行分析,就采用这个函数进行。

例如,如果需要比较“性别”栏目下的“男性”和“女性”,就可以采用这个函数。

理解这几种函数的变量后,一行代码就能实现Python数据分析。

使用指南

sweetviz支持Python 3.6+和Pandas0.25.3+环境,配置好环境后,使用万能的pip下载安装包:

img

但有一个条件需要注意:sweetviz需要用到基础「os」模块。所以,如果你在使用类似于Google Colab的自定义环境,可能会无法使用sweetviz,目前开发者也在探索解决方案。

下载好后,使用import快速导入sweetviz,就可以开始使用了~

img

sweetviz使用的原理是,使用一行代码,生成一个数据报告的对象(其中,my_dataframe是pandas中的DataFrame,一种表格型数据结构):
img

在这里,analyze函数可以被替换为compare或compare_intra函数,使用方法在上面已经给出,全看你需要什么类型的数据报告了。

最后,用show一键输出。(结果会以SWEETVIZ_REPORT.html网页形式展示)

img
由于在这个过程中,实际上真正需要编写的只有第二行的生成对象代码,可以说是名副其实的1行代码生成数据分析。

展示界面也非常简洁,只要鼠标停留在感兴趣的栏目上,右侧就会自动显示出数据分析的图表和报告。
动图封面

最后

如果对Python感兴趣的话,可以试试我的学习方法以及相关的学习资料

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、Python必备开发工具

在这里插入图片描述

三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

五、Python练习题

检查学习结果。
在这里插入图片描述
这份完整版的Python全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值