Scikit-learn

在这里插入图片描述在这里插入图片描述

项目过程

导包——加载数据——数据预处理——选择算法训练数据——测试数据——将测试结果导入.csv中
在这里插入图片描述

数据预处理

  • 删除无关特征:如用户ID,训练集和测试集都要删除
  • 将文本数据进行数值化:数据包含很多文本信息,需要将其转换成模型需要的类型
  • 填充缺失值:unknown样本需要填充
  • 进行特征与预测结果的探索性分析:查看各个特征对最后的预测结果影响,进而对特征进行选择

算法选择

二分类算法包括:逻辑回归、SVM、KNN、决策树、集成方法
集成方法精度更高,在此基础上可以研究GBDT,XGBoost,LightGBM等方法,或者深度学习
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

量子孤岛

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值