自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 头歌支持向量机算法

支持向量机”(SVM)是一种有监督的机器学习算法,可用于分类任务或回归任务。在该算法中,我们将每个数据绘制为n维空间中的一个点(其中n是特征的数量),每个特征的值是特定坐标的值。然后,我们通过找到很好地区分这两个类的一个超平面来执行分类的任务。简单来说,我们将其理解为现在有很多点,一部分的标签是+1,一部分的标签是-1,而且这些点一定能被一条直线划分成两部分,我们的任务是“画一条线”把不同标签的数据分开。如下图所示:中间这条线我们叫做"超平面"。当处理二维平面数据时,超平面为一条直线。

2024-04-27 11:44:55 1158

原创 头歌支持向量机简述

为了完成本关任务,你需要掌握:1.什么是支持向量机2.什么是最大化间隔,3.分类器求解最大化间隔SVM(支持向量机,英文全名:(SVM)是分类器的一种,SVM有很多种实现,但是我们只讲最流行的一种实现,即序列最小优化算法,即SMO算法。在正式介绍SVM之前,先解释几个概念考虑图6-1中个方框中的数据点分布,能否画出一条直线将圆形点和方形点分开?再考虑一张图片,看一看图6-2A中的两组数据这张图中的数据已经分的够开了,所以很容易在图中画出一条直线将两组数据点分开,在这种情况下,这种数据被称为线性可分数据。

2024-04-27 11:36:49 1108

原创 头歌机器学习 --- 神经网络

是一种具有局部连接、 权重共享等特性的深层前馈神经网络。想要识别图像中的物体,就需要提取出比较好的特征,该特征应能很好地描述想要识别的物体。所以物体的特征提取是一项非常重要的工作。卷积神经网络最早主要用来处理图像信息。搭建出卷积神经网络模型,再对模型进行训练,并将训练好的模型保存至。我们会加载你训练好的模型,并对测试集数据进行预测,预测正确率高于。操作能够较好地抓住物体特征的以上。

2024-04-27 11:33:06 2226

原创 头歌决策树算法

根据提示,在右侧编辑器补充代码,实现决策树信息熵构建,包括:平台会对你编写的代码进行测试:预期输出:提示: 参照示例完成任务。

2024-04-27 11:23:23 516

原创 头歌KNN算法详解

可以看出宅男和文艺青年的比分是 2:2,那么可以尝试将属于宅男的 2 个样本与我的总距离和属于文艺青年的 2 个样本与我的总距离进行比较。在这个例子中预测结果为文艺青年(宅男的总距离为 4.2+9.5,文艺青年的总距离为 7.7+5.8)。根据提示,在右侧编辑器的 begin-end 区域补充代码,完成 kNNClassifier 类中的 fit 函数与 predict 函数。假设现在有这样的一个样本空间,该样本空间里有宅男和文艺青年这两个类别,其中红圈表示宅男,绿圈表示文艺青年。

2024-04-22 16:52:50 3120

原创 头歌逻辑回归案例 - 癌细胞精准识别

乳腺癌数据集,其实例数量是 569 ,实例中包括诊断类和属性,帮助预测的属性一共 30 个,各属性包括为 radius 半径(从中心到边缘上点的距离的平均值), texture 纹理(灰度值的标准偏差)等等,类包括: WDBC-Malignant 恶性和 WDBC-Benign 良性。用数据集的 80% 作为训练集,数据集的 20% 作为测试集,训练集和测试集中都包括特征和类别。其中特征和类别均为数值类型,类别中 0 代表良性, 1 代表恶性。

2024-04-01 18:01:51 2641

原创 头歌逻辑回归模型-sklearn逻辑回归 - 手写数字识别

本关使用的是手写数字数据集,该数据集有 1797 个样本,每个样本包括 8*8 像素(实际上是一条样本有 64 个特征,每个像素看成是一个特征,每个特征都是float类型的数值)的图像和一个 [0, 9] 整数的标签。为下面题中的train_image。为下面题中的train_label,

2024-03-29 11:43:53 3303 1

原创 头歌逻辑回归算法

通过分析年龄、性别、体质指数、平均血压、疾病指数等指标,判断一个人是否换糖尿病,Y=0表示未患病,Y=1表示患病,这里的响应变量是一个两点(0-1)分布变量,它就不能用h函数连续的值来预测因变量Y(只能取0或1)。逻辑回归模型的求解即:给出一组m个样本数据,每个样本数据有n个特征,并且带有标记0或者1,代表属于哪一类,为了把输入的参数代入到预测函数后始终是一个0到1之间的数,这样我们可以把0,1看做两个类别。函数看成概率p,假设p=0.8,此时概率值离1很近,可以将数据类别判别为1;

2024-03-29 10:28:45 1434 2

原创 头歌线性回归简述

简单线性回归中,一个变量跟另一个变量的变化而变化,但是生活中,还有很多变量,可能由多个变量的变化决定着它的变化,比如房价,影响它的因素可能有:房屋面积、地理位置等等。在生活中,我们常常能碰到这么一种情况,一个变量会跟着另一个变量的变化而变化,如圆的周长与半径的关系,当圆的半径确定了,那么周长也就确定了。,那么,到底什么是线性回归呢?假如我们将青少年的身高和体重值作为坐标,不同人的身高体重就会在平面上构成不同的坐标点,然后用一条直线,尽可能的去拟合这些点,这就是简单的线性回归。表示特征值(如:体重值),

2024-03-29 10:22:59 350 1

原创 头歌线性回归案例- 波斯顿房价预测

波斯顿房价数据集共有506条波斯顿房价的数据,每条数据包括对指定房屋的13项数值型特征和目标房价组成。用数据集的80%作为训练集,数据集的20%作为测试集,训练集和测试集中都包括特征和目标房价。#获取训练数据#获取训练标签#获取测试数据。

2024-03-29 10:19:35 483 1

原创 头歌数据挖掘算法原理与实践:线性回归(房价预测)

那么差值的平方单位应该是千万级别的。我们误差的结果就跟我们数据是一个级别的了,在描述模型的时候就说,我们模型的误差是多少万元。大家知道已经,机器学习通常都是将训练集上的数据对模型进行训练,然后再将测试集上的数据给训练好的模型进行预测,最后根据模型性能的好坏选择模型,对于分类问题,大家很容易想到,可以使用正确率来评估模型的性能,那么回归问题可以使用哪些指标用来评估呢?上面的几种衡量标准针对不同的模型会有不同的值。如果为负数,则说明我们训练出来的模型还不如基准模型,此时,很有可能我们的数据不存在任何线性关系。

2024-03-25 14:52:06 2700

原创 头歌深入浅出 Python 机器学习:数据可视化

plt.scatter(X[:,0],X[:,1],c=y, edgecolor='k')#k有引号。

2024-03-24 17:08:19 1292 1

原创 头歌·深入浅出 Python 机器学习:数据生成

X, y=dataX, y=dataX, y=data。

2024-03-24 16:54:05 645 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除