python学习记录十八-Jupyter解决实际问题

最新推荐文章于 2022-09-19 15:26:31 发布

weixin_39425607

最新推荐文章于 2022-09-19 15:26:31 发布

阅读量193

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/weixin_39425607/article/details/117325068

版权

笔记专栏收录该内容

72 篇文章 0 订阅

订阅专栏

1.情景：在线音乐商店，用户注册时填写年龄，性别，基于他们个人的资料，推荐他们可能购买的音乐专辑，用机器学习来增加销售量
2.首先我们需要建立一个模型，用80%的样本数据为模型提供数据，用20%的用于测试。基于现有用户，我们的模型将学习数据中的模式。我们要求它做出预测。当一个新用户注册时，我们告诉模型，我们有一个新用户对应的配置文件，这个用户感兴趣的是什么类型的音乐？（简介：建立用户模型，统计并对比，类似推荐，榨干钱包）
3步骤：
import the data
clean the data
split the data into training/test sets
create a model
train the model
make predictions
4.数据csv格式导入
在这里插入图片描述

5.清洁数据或准备数据，删除重复，空值
6.分离数据，把原有的数据集分成两个独立的数据集，前两列作为输入集input dataset(也叫train data)，第三列作为输出集output dataset（包含了预测的结果,也叫train target）。即当我们告诉这个模型age和gender列的输入集，它就能告诉我们结果集genre(喜欢的音乐类型)
在这里插入图片描述