机器学习是人工智能的一个分支,类似于我们使用计算机设计一个系统,让它能够根据提供的训练数据按照一定的方式来学习,随着训练次数增加,该系统可以在性能上不断学习和该进,通过参数优化的学习模型,能够用于预测各种可能的情况
告诉计算机这个东西是什么,计算机自动提取特征
例如:自动驾驶
机器学习分有监督、无监督、增强学习三种
有监督:投喂一种标记(1,0)标签的太阳图像的各种形式的图像,告诉计算机它就是太阳,半监督学习数据一半
无监督:告诉系统100张图像有男的10张,女的90张,让系统自动聚类,进行分析,得到的结果不一定符合你的需求,能够快速分类;发现问题、用户细分、推荐系统。
分两种 一种是聚类、一种是降纬
加强学习:
- 机器有一个明确的小鸟角色——代理
- 需要控制小鸟飞的更远——目标
- 整个游戏过程中需要躲避各种水管——环境
- 躲避水管的方法是让小鸟用力飞一下——行动
- 飞的越远,就会获得越多的积分——奖励
通过机器自己学习来不断尝试来获得技能,
免模型学习(Model-Free) vs 有模型学习(Model-Based)
有模型学习(Model-Based)对环境有提前的认知,可以提前考虑规划,但是缺点是如果模型跟真实世界不一致,那么在实际使用场景下会表现的不好。
免模型学习(Model-Free)放弃了模型学习,在效率上不如前者,但是这种方式更加容易实现,也容易在真实场景下调整到很好的状态。所以免模型学习方法更受欢迎,得到更加广泛的开发和测试。
数据收集->数据清洗->特征工程->数据建模
python
numpy:添加关键数组变量类型,弥补python不足
pandas:添加了与excel类似的行列标签
matplotlib:让python有绘图能力
scikit-learn:机器学习库
tensorflow:深度学习框架-google
pytorch:深度学习框架-facebook
编程基础
k近邻
k近邻可以快速分类,不适合做图像分类,
数据集参考cifar-10