本次任务主要在于熟悉数据集,了解数据集,可以对数据集用文字或者图表进行总结。学习内容中对数据集的探查使用了head(),tail()来对数据集有一个整体认知,用shape(),descirbe(),info()等函数来看数据整体情况,以及isnull().sum()来探查NA情况,用value,counts()来探查数据的分布情况,skew()和kurt()来看数据的分布形状,并且用了seaborn的distplot来绘制数据形状。学习内容中还介绍了pandas_profiling,可以生成动态交互的数据探索报告,这是比较惊喜的部分,很适合用于数据探索初期。
零基础入门数据挖掘-心跳信号分类预测 Task2数据分析
最新推荐文章于 2022-03-27 23:23:26 发布