- Sklearn 中的数据库
- 导入数据-训练模型 波士顿房价数据
-
使用线性回归的方式——LinearRegression
- 基本理解:是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。
- 作用:以面向对象的思维,import不同数据打包,实例化后再对数据进行分析和训练
- 监督学习与非监督学习的区别:类似于上课听完课后是否再有大量考试训练,有大量考试的为监督学习,没有的为非监督学习,有少量的称为半监督学习(由数据和标签的数量决定)
- 实例操作 —— 使用iris鸢尾花数据集
-
一张图一个结果,做相应解说
由该次操作延申出的问题与收获
问题:需要去接触KNN算法
-
第一次测试结果:可见此时数据y的分类是有序的
- 将数据进行分类,分为训练集和测试集,以及预测值组和真实值组
-
规定测试集所占比例,此时规划好的数据y变为乱序,
后续处理数据也是如此,选择乱序的更有普适性
-
- 初步使用sklearn中模块
- Sklearn 中的数据库
- 导入数据-训练模型 波士顿房价数据
使用线性回归的方式——LinearRegression
可以看出预测值与真实值还存在一定误差
还需要尝试不同model或者改变一定参数减小误差
-
创建虚拟数据-可视化
noise表示噪声点,noise越大数据点越离散