任务2详见:任务2
按照任务内容学习执行了一遍
遇到问题如下
问题1.
#每个数字特征得分布可视化
f = pd.melt(data_train, value_vars=numerical_serial_fea)
g = sns.FacetGrid(f,col="variable",col_wrap=2,sharex=False,sharey=False)
g = g.map(sns.distplot,"value")
执行上面代码时结果显示的图为空白坐标
提示错误
RuntimeError: Selected KDE bandwidth is 0. Cannot estiamte density.
解决方法:
猜测可能是在后续执行过程中将matplotlib升级到 matplotlib-3.3.2后,重新执行后解决问题。(原理未知)
问题2
pfr = pandas_profiling.ProfileReport(data_train)
pfr.to_file("./example.html")
执行以上代码时候遇到错误
PicklingError: Could not pickle the task to send it to the workers.
解决方法
待解决
学到知识点
1.了解到并安装了pandas_profiling,用pandas_profiling生成数据报告,感觉发现了新大陆
2. 学习到遇见数据时,初步了解数据全貌的思路