天池比赛
文章平均质量分 90
天涯__
我不是归人,是个过客。
展开
-
天池初体验——新人实战赛之[离线赛]
写在开头:本篇博文的适用对象为对天池比赛完全不知如何下手的小伙伴。本文将从头开始记录如何最简单地整理数据、提取特征,再建立模型或者使用人工规则进行预测,然后选出数据并提交,最后得到结果。所以,本文并不会更多得关注特征的选择提取以及模型该如何建立。最后,本人所使用的工具为Spark,非常地方便,它包含了spark-sql工具,数据库默认使用的是derby,同时,Spark含有mllib库,能非常方便原创 2016-11-05 16:13:14 · 12190 阅读 · 8 评论 -
[转载]用Python做数据处理必看的12 个使效率倍增的Pandas技巧
查看原文:http://www.wyblog.cn/2016/12/07/%e8%bd%ac%e8%bd%bd%e7%94%a8python%e5%81%9a%e6%95%b0%e6%8d%ae%e5%a4%84%e7%90%86%e5%bf%85%e7%9c%8b%e7%9a%8412-%e4%b8%aa%e4%bd%bf%e6%95%88%e7%8e%87%e5%80%8d%e5%a2%9e%原创 2016-12-07 13:52:08 · 3056 阅读 · 1 评论 -
Iris数据集可视化分析
查看原文:http://www.wyblog.cn/2016/12/26/iris%e6%95%b0%e6%8d%ae%e9%9b%86%e5%8f%af%e8%a7%86%e5%8c%96%e5%88%86%e6%9e%90/查看原文:http://www.wyblog.cn/2016/12/26/iris%e6%95%b0%e6%8d%ae%e9%9b%86%e5%8f%af%e8%a7%86原创 2016-12-26 20:57:50 · 3403 阅读 · 0 评论