数据科学实战
数据科学的实际应用
明曦君
入门的数据价值奋斗者,努力中ing
展开
-
Titanic Kaggle 竞赛技术小结(三|终):模型训练
写在开头:在本节中仅展示python中调用机器学习的方法,已经评价的方法,具体对于每种机器学习模型的算法与理解,可能会在后面的章节进行展开。回归前文在前文中我们分享了一些数据查看和清洗的技巧,一些在Titanic 比赛上的数据可视化技巧。可以点击链接进行查看,Titanic Kaggle 竞赛技术小结(一)Titanic Kaggle 竞赛技术小结(二)技术总结一、全文思路Ste...原创 2020-02-17 18:50:42 · 304 阅读 · 2 评论 -
数据科学实战系列之ML-KNN(一)
写在开头:最近确实事情比较多,每天没有啥时间去学习其他的东西,也就没有时间来继续创作博客,不过最近学习了一些多标签分类的东西,并简单的实现了一下。内容安排对于多标签分类任务还有许多常见的方法比如ML-DT(决策树)、Rank-SVM等,由于ML-KNN沿袭KNN的思想比较容易上手,于是本文将对多标签分类任务中的ML-KNN算法进行简单的介绍,并通过代码进行实例操作,使用数据及为MULAN的eurlex-directory-codes(点击可下载)。1.ML-KNN算法简介ML-KNN的核心思想与.原创 2020-06-02 22:31:54 · 3791 阅读 · 0 评论 -
Titanic Kaggle 竞赛技术小结(二):数据可视化
写在开头:接着上一次的分析,开始对数据可视化的分析展示回归前文在前文中我们分享了一些数据查看和清洗的技巧,小面展示一些在Titanic 比赛上的数据可视化技巧。可以点击链接进行查看,Titanic Kaggle 竞赛技术小结(一)技术总结一、全文思路Step1. 载入数据、包,并查看数据;Step2. 对数据进行清洗,包括去重复值、异常值、缺失值或特征化数值化处理;Step...原创 2020-02-15 11:48:23 · 334 阅读 · 2 评论 -
Titanic Kaggle 竞赛技术小结(一):数据预处理
写在开头:这次的分享是Kaggle比赛的入门级项目Titanic的一些技术上的小结,并且会展开某些技术上的细节进行说明。相关重述问题背景:泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,在它的处女航中,泰坦尼克号便遭厄运——它从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰科夫(Cobh),驶向美国纽约。1912年4月14日23时40分左右,泰坦尼克号与一座冰山相撞,造成...原创 2020-02-14 17:45:16 · 612 阅读 · 2 评论