机器学习入门
1基本概念
机器学习是什么
让计算机从数据中进行自动学习,得到某种知识或规律。
将其转换为决策模型,然后将其用于未来的预测
数据集
指一组样本构成的集合。一般将数据集分为两部分:训练集和测试集。
训练集中的样本是用来训练模型,而测试集中的样本是用来检验模型好坏。
学习与训练
不断找到最优模型(最优的从输入x映射到输出y的关系)
2算法的类型
2.1有监督学习
概念
如果机器学习的目标是建模样本的特征 𝒙 和标签 𝑦 之间的关系,并且训练集中每个样本都有标签,那么这类机器学习称为监督学习。(无监督学习则没有标签)
根据标签类型的不同,监督学习又可以分为回归问题、分类问题、结构化学习。
回归问题
利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模。
回归问题的输出是连续值。比如未来几年预测房屋价格的走势,价格是一个连续的值。
(回归问题通常有一元线性回归和多元线性回归,通常用最小二乘法解决)
分类问题
分类问题的输出是离散值。分类问题根据其类别数量又可分为