Sherri535-CSDN博客

原创头歌支持向量机算法

支持向量机”（SVM）是一种有监督的机器学习算法，可用于分类任务或回归任务。在该算法中，我们将每个数据绘制为n维空间中的一个点（其中n是特征的数量），每个特征的值是特定坐标的值。然后，我们通过找到很好地区分这两个类的一个超平面来执行分类的任务。简单来说，我们将其理解为现在有很多点，一部分的标签是+1，一部分的标签是-1，而且这些点一定能被一条直线划分成两部分，我们的任务是“画一条线”把不同标签的数据分开。如下图所示：中间这条线我们叫做＂超平面＂。当处理二维平面数据时，超平面为一条直线。

2024-04-27 11:44:55 1158

原创头歌支持向量机简述

为了完成本关任务，你需要掌握：1.什么是支持向量机2.什么是最大化间隔，3.分类器求解最大化间隔SVM(支持向量机，英文全名：(SVM)是分类器的一种，SVM有很多种实现，但是我们只讲最流行的一种实现，即序列最小优化算法,即SMO算法。在正式介绍SVM之前，先解释几个概念考虑图6-1中个方框中的数据点分布，能否画出一条直线将圆形点和方形点分开？再考虑一张图片，看一看图6-2A中的两组数据这张图中的数据已经分的够开了，所以很容易在图中画出一条直线将两组数据点分开，在这种情况下，这种数据被称为线性可分数据。

2024-04-27 11:36:49 1108

原创头歌机器学习 --- 神经网络

是一种具有局部连接、权重共享等特性的深层前馈神经网络。想要识别图像中的物体，就需要提取出比较好的特征，该特征应能很好地描述想要识别的物体。所以物体的特征提取是一项非常重要的工作。卷积神经网络最早主要用来处理图像信息。搭建出卷积神经网络模型，再对模型进行训练，并将训练好的模型保存至。我们会加载你训练好的模型，并对测试集数据进行预测，预测正确率高于。操作能够较好地抓住物体特征的以上。

2024-04-27 11:33:06 2226

原创头歌决策树算法

根据提示，在右侧编辑器补充代码，实现决策树信息熵构建，包括：平台会对你编写的代码进行测试：预期输出：提示：参照示例完成任务。

2024-04-27 11:23:23 516

原创头歌KNN算法详解

可以看出宅男和文艺青年的比分是 2:2，那么可以尝试将属于宅男的 2 个样本与我的总距离和属于文艺青年的 2 个样本与我的总距离进行比较。在这个例子中预测结果为文艺青年(宅男的总距离为 4.2+9.5，文艺青年的总距离为 7.7+5.8)。根据提示，在右侧编辑器的 begin-end 区域补充代码，完成 kNNClassifier 类中的 fit 函数与 predict 函数。假设现在有这样的一个样本空间，该样本空间里有宅男和文艺青年这两个类别，其中红圈表示宅男，绿圈表示文艺青年。

2024-04-22 16:52:50 3120

原创头歌逻辑回归案例 - 癌细胞精准识别

乳腺癌数据集，其实例数量是 569 ，实例中包括诊断类和属性，帮助预测的属性一共 30 个，各属性包括为 radius 半径（从中心到边缘上点的距离的平均值）， texture 纹理（灰度值的标准偏差）等等，类包括： WDBC-Malignant 恶性和 WDBC-Benign 良性。用数据集的 80% 作为训练集，数据集的 20% 作为测试集，训练集和测试集中都包括特征和类别。其中特征和类别均为数值类型，类别中 0 代表良性， 1 代表恶性。

2024-04-01 18:01:51 2641

原创头歌逻辑回归模型-sklearn逻辑回归 - 手写数字识别

本关使用的是手写数字数据集，该数据集有 1797 个样本，每个样本包括 8*8 像素（实际上是一条样本有 64 个特征，每个像素看成是一个特征，每个特征都是float类型的数值）的图像和一个 [0, 9] 整数的标签。为下面题中的train_image。为下面题中的train_label，

2024-03-29 11:43:53 3303 1

原创头歌逻辑回归算法

通过分析年龄、性别、体质指数、平均血压、疾病指数等指标，判断一个人是否换糖尿病，Y=0表示未患病，Y=1表示患病，这里的响应变量是一个两点（0-1）分布变量，它就不能用h函数连续的值来预测因变量Y（只能取0或1）。逻辑回归模型的求解即：给出一组m个样本数据，每个样本数据有n个特征，并且带有标记0或者1，代表属于哪一类，为了把输入的参数代入到预测函数后始终是一个0到1之间的数，这样我们可以把0，1看做两个类别。函数看成概率p，假设p=0.8，此时概率值离1很近，可以将数据类别判别为1；

2024-03-29 10:28:45 1434 2

原创头歌线性回归简述

简单线性回归中，一个变量跟另一个变量的变化而变化，但是生活中，还有很多变量，可能由多个变量的变化决定着它的变化，比如房价，影响它的因素可能有：房屋面积、地理位置等等。在生活中，我们常常能碰到这么一种情况，一个变量会跟着另一个变量的变化而变化，如圆的周长与半径的关系，当圆的半径确定了，那么周长也就确定了。，那么，到底什么是线性回归呢？假如我们将青少年的身高和体重值作为坐标，不同人的身高体重就会在平面上构成不同的坐标点，然后用一条直线，尽可能的去拟合这些点，这就是简单的线性回归。表示特征值(如：体重值)，

2024-03-29 10:22:59 350 1

原创头歌线性回归案例- 波斯顿房价预测

波斯顿房价数据集共有506条波斯顿房价的数据，每条数据包括对指定房屋的13项数值型特征和目标房价组成。用数据集的80%作为训练集，数据集的20%作为测试集，训练集和测试集中都包括特征和目标房价。#获取训练数据#获取训练标签#获取测试数据。

2024-03-29 10:19:35 483 1

原创头歌数据挖掘算法原理与实践：线性回归（房价预测）

那么差值的平方单位应该是千万级别的。我们误差的结果就跟我们数据是一个级别的了，在描述模型的时候就说，我们模型的误差是多少万元。大家知道已经，机器学习通常都是将训练集上的数据对模型进行训练，然后再将测试集上的数据给训练好的模型进行预测，最后根据模型性能的好坏选择模型，对于分类问题，大家很容易想到，可以使用正确率来评估模型的性能，那么回归问题可以使用哪些指标用来评估呢？上面的几种衡量标准针对不同的模型会有不同的值。如果为负数，则说明我们训练出来的模型还不如基准模型，此时，很有可能我们的数据不存在任何线性关系。

2024-03-25 14:52:06 2700

原创头歌深入浅出 Python 机器学习：数据可视化

plt.scatter(X[:,0],X[:,1],c=y, edgecolor='k')#k有引号。

2024-03-24 17:08:19 1292 1

原创头歌·深入浅出 Python 机器学习：数据生成

X, y=dataX, y=dataX, y=data。

2024-03-24 16:54:05 645 1

2302_80089843的博客