1 理解机器学习
1.1机器学习的基本思路
从语义层次看,机器学习是指计算机能模拟人的学习行为,通过学习获取知识和技能 ,不断改善性能,实现自我完善。
三个关键要素:
如果一个计算机系统在完成某一类任务T的性能P能够随着经验E而改进,则 称该系统在从经验E中学习,并将此系统称为一个学习系统
1.2常见应用
1.3基本类型
分为:有监督学习、无监督学习、强化学习
有监督学习:有具体的目标任务,比如过滤垃圾邮件,将y分为两类0或1,表示是否为垃圾文件,预测直接将其进行标记分类。
无监督学习:无具体的目标任务,比如主成分分析,聚类分析。
(28条消息) 机器学习两种方法——监督学习和无监督学习(通俗理解)_风翼冰舟的博客-CSDN博客
2机器学习流程
2.1流程
0.收集数据
1.对数据集进行预处理
包含数据预处理及特征提取
2.划分数据集(训练集、测试集、验证集)
3.训练测试模型
4.评估模型
5 优化模型
2.2模型选择
•如果目标变量是数值型变量,建立回归方程(多变量数学表达式)
•如果目标变量是类别型变量,建立分类模型(类概率估计模型)
3初步了解sklearn库
•Sklearn是Python提供的非常强大的机器学习库,节省编写代码的时间减少代码量 •Sklearn 提供监督和无监督学习的方法
•Sklearn 包含两大类函数:估计器(Estimator)和转化器(Transformer)
估计器(estimator)是⼀个重要的⾓⾊,分类和回归模型都属于estimator,是实现算法的API,使用时调用。
估计器的流程:数据划分为训练集和测试集。训练集包括x_train、y_train, 调⽤fit传⼊x_train、y_train,;模型建⽴好之后查看预测数据准确与否,输⼊测试集的数据x_test、y_test, 调⽤predict(x_test), 每个算法都包括score⽅法,查看预测的准确性 score(x_test,y_test),