目录
1 思维导图
2 智能奇旅:机器学习导论
2.1 机器学习的概念
机器学习是从历史数据中学习规律,然后应⽤该规律预测未来的过程。
2.2 机器学习的研究问题
(1)回归
⽬标:对已有的数据进⾏拟合,再根据拟合出来的函数,对未来进⾏预测。
⽅法:机器需要找到已知分类的划分规则,在应⽤该划分规则对事物进⾏分类
(2)分类
⽬标:研究如何判断⼀个事物属于已知分类中的哪⼀类。
⽅法:机器需要对已有的数据进⾏拟合,再根据拟合出来的函数,对某个过程进⾏预测
(3)聚类
⽬标:对未分组的事物进⾏分组
⽅法:机器需要根据事物之间的相似性,将事物划分为若⼲组,并添加标签
(4)降维
⽬标:提取⾼维度数据中的关键信息
⽅法:机器需要分析不同维度数据的重要程度,进⽽提取出数据中的关键信息
2.3 机器学习的简单分类
(1)监督学习
L回归
分类
......
(2)⽆监督学习
聚类
降维
......
(3)机器学习的⽤途
图像识别
语⾳识别
精准定位
内容推荐
2.4 机器学习涉及的内容数学知识
线性代数:向量、矩阵、线性变换.、特征值、奇异值......
截积分:导数、偏导数......
概率论:⻉叶斯定律、伯努利分布、正态分布……
统计学:⽅差、协⽅差、相关系数、参数估计、假设检验......
凸优化:线性规划、⼆次规划、最⼩⼆乘优化、正则化......
2.5 编程知识
(1)Python基础语法
基本数据类型、循环、条件判断、函数、类与模块......
(2)Python常⽤模块
numpy 库、pandas 库、matplotlib 库、scipy 库. sklearn 库......
2.6 算法知识
(1)监管学习算法
回归:线性回归、保序回归......
分类:K近邻、⽀持向量机、决策树、神经⽹络......
(2)⽆监督学习算法
聚类 :K-Means聚类.谱聚类......
隆惟:主成分分析、线性判别分析......
(3)KNN 算法
概念:
全称 K Nearest Neighbors,是⼀种适⽤于分类问题的监督学习算法。
计算步骤
1)计算未知事务与每个已知分类特征之间的距离。
2)选取合适的 K 值,找出距离中前 K 个最小值所对应的已知分类。
3)根据少数服从多数的原则,对新事务的类别进行预测。
3 python代码体验
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
#~~~~~~~~Step1 读取数据~~~~~~~~~~~~~
df = pd .read_csv ( "./工作/insect.csv" )
x= df[['翅长','触角长']].values
y = df['类别'].values
#~~~~~~~Step2数据预处理~~~~~~~~~~~~~~
#最后3个样本为未知样本﹐其余样本为已知样本
train_X = x[:-3]
train_Y = y[:-3]pred_X = ×[-3:]
#~~~~~~~Step3 训练模型~~~~~~~~~~~~~~~~`
# 在K近邻分类器中,K值通过参数n_neighbors设置
model = KNeighborsclassifier(n_neighbors=3)
model.fit(train_X, train_Y)
#~~~~~~~Step4应用模型~~~~~~~~~~~~~~~`
# 应用训练出的模型预测未知蚊子的类别
pred_Y = model.predict(pred_X)print(pred_Y)