Kaggle
xunuo_nwpu
这个作者很懒,什么都没留下…
展开
-
Kaggle Titanic: Machine Learning from Disaster
本题的关键主要在于数据可视化和数据清洗,seaborn,matplotlib对于机器学习框架sklearn作为了解# Imports# pandasimport pandas as pdfrom pandas import Series,DataFrame# numpy, matplotlib, seabornimport numpy as npimport matplotli...原创 2019-08-31 10:18:33 · 173 阅读 · 0 评论 -
原始数据预处理之逼近正态分布
House Prices: Advanced Regression Techniques1.histogram直方图默认纵轴为频率,各种房子的售价和频率的图,感觉参考价值不是很大,但是直方图很经典2.scatter散点图concat数据合并与重塑,将df_train中的两列取出来。上面散点图的样子就可以被近似认为是线性关系。3.boxpolt箱型图上面plt.subplot是画子...转载 2019-09-10 14:54:27 · 885 阅读 · 0 评论 -
Kaggle常用图总结
好不容易写了一堆,然后被覆盖了,歪日,心态崩掉。。。。重写引用于此篇文章,题目:House Prices: Advanced Regression Techniques1.histogram直方图纵轴默认为每个售价出现的频率,没有太大参考价值。但直方图非常有用2.scatter plot散点图上述两个变量的关系可近似认为是线性关系。pd.concat是数据的提取和重组。3.box...原创 2019-09-10 15:59:01 · 310 阅读 · 0 评论 -
Stacking集成学习完成Kaggle Titanic Disaster
本文想要做一个Kaggle两个题目解题的融合,即Stacked Regressions on House Prices: Advanced Regression TechniquesA Journey through Titanic两篇文章都属于回归问题,且题目很相似,都包含大量影响因素第一篇文章处理数据后用了Stacking集成学习方法融合了多个模型,最终得到比单独模型效果都要好的Sta...原创 2019-09-11 22:36:33 · 470 阅读 · 0 评论