更新:发个招实习生广告:我们实验室常年招合作学生,需要AI/ML/DL/IoT方向,可远程工作,有导师带领参与项目及论文合作(ps: 我导师超级温柔nice细心严谨靠谱,前几日带合作学生写的paper刚被顶会接收)。有意者请发送简历至邮箱wei.shao@rmit.edu.au,具体信息见我主页最新一条想法。(有啥疑问也可以直接私信我 :D)
======原答案分界线======
最近发现一个神奇的库pandas-profiling,一行代码生成超详细数据分析报告,实乃我等数据分析从业者的福音哈哈~一键生成超详细数据分析报告https://www.zhihu.com/video/1143534815029669888
一般来说,面对一个数据集,我们需要做一些探索性分析 (Exploratory data analysis),这个过程繁琐而冗杂。以泰坦尼克号数据集为例,传统方法是先用Dataframe.describe():
import pandas as pd
data = pd.read_csv('https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv')
data.describe()
通过describe()方法,我