自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 线性回归方法

第1关:数据载入与分析。

2024-04-09 21:52:31 631

原创 AGNES层次聚类方法

本关任务:根据本关所学知识,完成函数,函数以及函数分别实现计算两个簇之间的最短距离、最远距离和平均距离。为了完成本关任务,你需要掌握:算法是一种自底向上聚合的层次聚类算法,它先会将数据集中的每个样本看作一个初始簇,然后在算法运行的每一步中找出距离最近的两个簇进行合并,直至达到预设的簇的数量。所以算法需要不断的计算簇之间的距离,这也符合聚类的核心思想(物以类聚,人以群分),因此怎样度量两个簇之间的距离成为了关键。衡量两个簇之间的距离通常分为最小距离、最大距离和平均距离。在算法中可根据具体业务选择其中一种距离作

2024-04-09 21:50:18 1093

原创 DBScan密度聚类方法

第1关:两点之间距离及相邻条件判断。

2024-04-09 21:48:12 1018

原创 K-means聚类方法

第1关:计算欧几里得距离。

2024-04-09 21:44:47 1529

原创 Python机器学习软件包Scikit-Learn的学习与运用

第1关:使用scikit-learn导入数据集scikit-learn包括一些标准数据集,不需要从外部下载,可直接导入使用,比如与分类问题相关的数据集和手写图像数据集,与回归问题相关的。以下列举一些简单的数据集,括号内表示对应的问题是分类还是回归:这些标准数据集采用类字典的对象格式存储,比如.data表示原始数据,是一个二维数组,通过.shape可以得到二维数组大小,.target表示存储数据类别即标签。

2024-04-09 21:42:06 1706 1

原创 EM算法

没有接触过或者没有听过”极大似然估计“的同学可能会被这个名词唬住(每个字都认识,但是连起来就不知道是什么意思了),我们不妨拆字释意。光看拆字释意后的解释可能还是有点绕。不如举个例子:一个袋子中总共有黑白两种颜色的球,总共有 100 个,其中一种颜色的球有 90 个。现在随机从袋子中取出一个球,发现是黑球。那么问你是黑色球有 90 个,还是白色球 90 个?此时你可能会认为是黑色球有 90 个。

2024-04-09 21:29:31 1246

原创 朴素贝叶斯分类器

概率指的是某一事件A发生的可能性,表示为P(A)。而条件概率指的是某一事件A已经发生了条件下,另一事件B发生的可能性,表示为P(B|A),举个例子:今天有25%的可能性下雨,即P(下雨)=0.25;今天75%的可能性是晴天,即P(晴天)=0.75;如果下雨,我有75%的可能性穿外套,即P(穿外套|下雨)=0.75;如果下雨,我有25%的可能性穿T恤,即P(穿T恤|下雨)=0.25;从上述例子可以看出,条件概率描述的是右边的事件已经发生之后,左边的事件发生的可能性,而不是两个事件同时发生的可能性!

2024-04-09 21:25:33 1498

原创 主成分分析PCA

乳腺癌数据集,其实例数量是569,实例中包括诊断类和属性,帮助预测的属性一共30个,各属性包括为radius半径(从中心到边缘上点的距离的平均值),texture恶性和良性。用数据集的80%作为训练集,数据集的20%作为测试集,训练集和测试集中都包括特征和诊断类。sklearn中已经提供了乳腺癌数据集的相关接口,想要使用该数据集可以使用如下代码:#加载乳腺癌数据集#X表示特征,y表示标签数据集中部分数据与标签如下图所示(其中0表示良性,1。

2024-04-09 21:19:27 1142

原创 特征工程——共享单车之租赁需求预估

第1关:数据探索与可视化。

2024-04-09 19:36:41 1282

原创 Adaboost算法

集成学习方法是一种常用的机器学习方法,分为bagging与boosting两种方法,应用十分广泛。集成学习基本思想是:对于一个复杂的学习任务,我们首先构造多个简单的学习模型,然后再把这些简单模型组合成一个高效的学习模型。实际上,就是“三个臭皮匠顶个诸葛亮”的道理。集成学习采取投票的方式来综合多个简单模型的结果,按bagging投票思想,如下面例子:假设一共训练了5个简单模型,每个模型对分类结果预测如上图,则最终预测结果为:A:2B:33>2结果为B。

2024-04-09 19:34:21 1393

原创 softmax回归

本关任务:使用实现函数。为了完成本关任务,你需要掌握:1.回归原理,2.函数。与逻辑回归一样,回归同样是一个分类算法,不过它是一个多分类的算法,我们的数据有多少个特征,则有多少个输入,有多少个类别,它就有多少个输出。如上图,可以看出我们的数据有四个特征,三个类别。每个输入与输出都有一个权重相连接,且每个输出都有一个对应的偏置。具体公式如下:z1​=x1​w11​+x2​w12​+x3​w13​+x4​w14​+b1​z2​=x1​w21​+x2​w22​+x3​w23​+x4​w24​+b2​z3​=x1​

2024-04-09 19:30:33 1393

原创 逻辑回归

当一看到“回归”这两个字,可能会认为逻辑回归是一种解决回归问题的算法,然而逻辑回归是通过回归的思想来解决二分类问题的算法。那么问题来了,回归的算法怎样解决分类问题呢?其实很简单,逻辑回归是将样本特征和样本所属类别的概率联系在一起,假设现在已经训练好了一个逻辑回归的模型为 f(x) ,模型的输出是样本 x 的标签是 1 的概率,则该模型可以表示, p^​=f(x)。若得到了样本 x 属于标签 1 的概率后,很自然的就能想到当 p^​>0.5 时 x 属于标签 1 ,否则属于标签 0。所以就有。

2024-04-09 19:25:38 1762

原创 随机森林

Bagging 是 Bootstrap Aggregating 的英文缩写,刚接触的童鞋不要误认为 Bagging 是一种算法, Bagging 和 Boosting 都是集成学习中的学习框架,代表着不同的思想。与 Boosting 这种串行集成学习算法不同, Bagging 是并行式集成学习方法。大名鼎鼎的随机森林算法就是在 Bagging 的基础上修改的算法。** Bagging 方法的核心思想就是三个臭皮匠顶个诸葛亮**。

2024-04-09 19:18:21 1204

原创 决策树

鸢尾花数据集是一类多重变量分析的数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(SetosaVirginica)三个种类中的哪一类(其中分别用012代替)。

2024-04-09 19:15:46 1143

原创 局部加权线性回归

在局部加权算法中 ,我们给待预测点附近的每个点赋予一定的权重;然后与前面的类似,在这个子集上基于最小均方差来进行普通的回归。与kNN一样,这种算法每次预测均需要事先选取出对应的数据子集。为了完成本关任务,你需要掌握:1.局部加权算法的思想;2.局部加权的核心算法。根据提示,在右侧编辑器补充代码,利用局部加权计算回归系数。本关任务:编写一个利用局部加权计算回归系数的小程序。其中w是一个矩阵,用来给每个数据点赋予权重。根据所学完成右侧编程题。

2024-04-09 19:08:20 629

原创 缩减系数来“ 理解”数据——岭回归

头歌实践教育平台机器学习实验

2024-04-03 11:48:24 1114 1

原创 指针——《C++ Primer 5》

指针!终于让我领悟到了一丢丢!!太激动了所以赶快写下来!p :一个变量,如1,2...&p:取变量p的地址,如0XA0,0Xeff14*p:定义一个指针。

2023-08-07 21:19:57 60

原创 每日小练——《C++ Primer 5》

C++ Primer

2023-07-23 23:47:57 65

原创 第十四届蓝桥杯第三期模拟赛(自我激励版)

第十四届蓝桥杯模拟赛第三期,还在更新中~

2023-03-06 20:02:14 262 2

原创 蓝桥杯-乘积尾零

蓝桥杯-乘积尾零。题目:如下的 10 行数据,每行有 10 个整数,请你求出它们的乘积的末尾有多少个零?

2023-02-10 21:46:26 118 1

原创 (3n+1)猜想

含义:输入一个大于1自然数n,若n为奇数,则将n变为3n+1,否则变为n的一半。经过若干次这样的变化,一定会使n变为1。cout

2022-11-08 20:38:26 422 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除