机器学习--基础算法
Mr_Wang0120
这个作者很懒,什么都没留下…
展开
-
机器学习--基础算法--贝叶斯网络
贝叶斯算法预测鸢尾花数据集:# 导入算法包以及数据集import numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import classification_report,confusion_matrix# 多项式模型、伯努利模型、高斯模型from sklearn.naive_bayes impor...原创 2020-05-21 16:49:02 · 285 阅读 · 0 评论 -
机器学习--基础算法--集成学习
1 什么是集成学习import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsx, y = datasets.make_moons(n_samples=500, noise = 0.3, random_state=42)plt.scatter(x[y == 0, 0], x[y == 0, 1])plt.scatter(x[y == 1, 0], x[y == 1, 1])plt.show()原创 2020-05-19 08:43:00 · 273 阅读 · 0 评论 -
机器学习--基础算法--决策树
1 什么是决策树使用决策树对鸢尾花数据集进行分类:import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsiris = datasets.load_iris()x = iris.datay = iris.targetx = x[:, 2:]plt.scatter(x[y == 0, 0], x[y == 0, 1])plt.scatter(x[y == 1, 0], x[y == 1,原创 2020-05-17 09:22:33 · 249 阅读 · 0 评论 -
机器学习--基础算法--支撑向量机 SVM
1 什么是支撑向量机2 如何最大化hard margin3 soft margin 和SVM的正则化4 scikit-learn中的SVMimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsiris = datasets.load_iris()x = iris.datay = iris.targetx = x[y < 2, :2]y = y[y <原创 2020-05-15 20:34:39 · 174 阅读 · 0 评论 -
机器学习--基础算法--评价分类结果
1 准确度的陷阱和混淆矩阵分类准确度的问题:一个癌症预测系统,输入体检信息,可以判断是否有癌症。预测准确度: 99.9%。如果癌症产生的概率只有0.1%,我们的系统预测所有人都是健康,即可达到99.9%的准确率。对于极度偏斜(Skewed Data)的数据,只使用分类准确度是远远不够的。使用混淆矩阵做进一步的分析。2 精准率和召回率3 精准率、召回率和F1 Score的衡量效果4 精准率、召回率的平衡精准率和召回率是相互制约的。一方增大,另一方就会减小。5 实现混淆矩阵,原创 2020-05-13 10:20:40 · 289 阅读 · 0 评论 -
机器学习--基础算法--逻辑回归
1 什么是逻辑回归逻辑回归:解决分类问题回归问题怎么解决分类问题?将样本的特征和样本发生的概率联系起来,概率是一个数.2 逻辑回归的损失函数原创 2020-05-11 17:13:31 · 238 阅读 · 0 评论 -
机器学习--基础算法--多项式回归与模型泛化
1 scikit-learn中的多项式回归与pipelineimport numpy as npimport matplotlib.pyplot as pltx = np.random.uniform(-3, 3, size = 100)print(x.shape)x1 = x.reshape(-1, 1)print(x1.shape)y = 0.5 * x ** 2 + 2 + np.random.normal(0, 1, 100)print(y.shape)>>>(1原创 2020-05-10 11:04:56 · 271 阅读 · 0 评论 -
机器学习--基础算法--PCA与梯度上升法
1 什么是PCA主成分分析:●一个非监督的机器学习算法●主要用于数据的降维。通过降维,可以发现更便于人类理解的特征●其他应用:可视化;去噪2 使用梯度上升法求解PCA问题...原创 2020-05-07 11:24:11 · 237 阅读 · 0 评论 -
机器学习--基础算法--梯度下降法
1 什么是梯度下降法说明:不是一个机器学习算法是一种基于搜索的最优化方法作用:最小化一个损失函数梯度上升法:最大化一个效用函数●η称为学习率(learning rate)●η的取值影响获得最优解的速度●n取值不合适,甚至得不到最优解●n是梯度下降法的一个超参数并不是所有函数都有唯一的极值点解决方案:●多次运行,随机化初始点●梯度下降法的初始点也是一个超参数...原创 2020-05-05 10:01:43 · 357 阅读 · 0 评论 -
机器学习--基础算法--线性回归法
1 简单线性回归线性回归算法的特点:1.解决回归问题2.思想简单,实现容易3.许多强大的非线性模型的基础4.结果 具有很好的可解释性5.蕴含机器学习中的很多重要思想样本特征只有一个,称为简单线性回归样本特征有多个,称为多元线性回归假设我们找到了最佳拟合的直线方程:y=ax+b。则对于每一个样本点x(i)(i)(i)我们希望y’)和yi的差距尽量小表达y"和y"的差距:则对于...原创 2020-05-02 20:36:31 · 640 阅读 · 0 评论 -
机器学习--基础算法--最基础的分类算法-k近邻算法 kNN
1 scikit-learn中的机器学习算法封装k近邻算法的实现:import numpy as npfrom math import sqrtfrom collections import Counterdef KNN_classify(k, x_train, y_train, x): assert 1 <= k <= x_train.shape[0], 'k m...原创 2020-04-30 16:42:29 · 361 阅读 · 0 评论 -
机器学习--基础算法--机器学习基础
1 机器学习世界的数据1.数据数据整体叫数据集(data set)每一行数据称为一个样本(sample)除最后一列,每一列表达样本的一个特征(eature)最后一列,称为标记(label)第i个样本行写作X(i),第i个样本第j个特征值写作Xj(i),第i个样本的标记写作y(i)2 机器学习的主要任务机器学习的基本任务:·分类·回归分类任务:二分类;多分类;多标签分类回归任...原创 2020-04-25 15:57:46 · 325 阅读 · 0 评论 -
机器学习---基础算法-第1天
import operatorimport numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom time import timeimport mathdef is_prime(x): return 0 not in [x % i for i in range(2, int(math.s...原创 2020-04-23 21:52:35 · 233 阅读 · 0 评论