机器学习笔记-1 什么是机器学习
机器学习是什么?
对于模型来说,基因决定上限,数据决定下限。
机器学习可以做什么?
图片识别
互联网推荐:根据关系网络和历史行为,通过用户数据
自动驾驶:5G解决数据延迟
修复古文献
帮川普赢得大选通过机器学习模型,预测用户的信息
机器学习基本概念
监督学习 VS 无监督学习
分类方法:结果是类别值,如情感的正负
回归方法:预测的标签是连续值,不是类别值,如年龄
聚类方法:…
————————————
数据:训练数据
样本:训练数据中有多个样本
标签:每个样本的特征,可以打上一个标签,如黑种人/白种人/黄种人
特征向量:多个标量组成特征向量
————————————
假设空间
机器学习的过程,就是从假设空间进行“搜索”的过程。是一个集合。
版本空间
用不同的模型方案,可以“搜索”到不同的假设,这个假设的集合叫做版本空间。如:一个模型,用逻辑回归(LR)、Xgboost、深度学习(CNN)三个不同的模型方案训练,会得到三个函数模型,这三个函数模型就是这个模型的版本空间。
—————————————
没有免费午餐定理
NFL定理:一个算法若在某些问题上比另一个算法好,比存在另一些问题,不如其他算法。
先修知识
数学知识:高中数学即可
线性代数:了解矩阵知识
概率论:对概率论大体上有一定的认识,大学课本足够了(浙大)