1、什么是机器学习?
机器学习是从数据中自动分析获得模型,并且利用模型对未知数据进行预测。
2、机器学习的数据集:
数据集由特征值+目标值
3、机器学习的算法分类:
监督学习:
目标值:类别-分类问题
K近邻、贝叶斯分类、决策树和随机森林、逻辑回归
目标值:连续型的数据-回归问题
线性回归,岭回归
无监督学习:
目标值:无-无监督学习
聚类:K-means算法
4、机器学习开发流程
获取数据-数据处理-特征工程-机器学习训练模型-模型评估-应用
5、可用数据集:
公司内部:百度
数据接口:花钱
数据集
学习阶段可用数据集:sklea