机器学习
Chemlez
学生党一枚~ 个人主页(文章首发地址):https://www.chemlez.cn/
展开
-
机器学习-特征工程之数据预处理
在上一节中的泰坦尼克号入门案例的数据预处理过程中,出现了数据不完整、数据的编码(数值转化),即将非结构化文本转化为结构化文本。本文主要用来记录在sklearn中常用的数据预处理基本方法。数据预处理从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程。可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常...原创 2020-04-09 20:32:18 · 314 阅读 · 0 评论 -
机器学习-决策树入门之泰坦尼克号案例
本文用于记录机器学习中的一次入门练习,即:利用决策树进行简单的二分类。同时,结合Kaggle上的经典案例Titanic,来测试实际效果。一、数据集采用Kaggle中的Titanic的数据集。数据包含分为:训练集: training set (train.csv)测试集: test set (test.csv)提交标准: gender_submission.csv由于Kaggle涉及...原创 2020-03-15 20:48:27 · 681 阅读 · 0 评论