机器学习
文章平均质量分 61
机器学习
Eva_5433
人生没有白走的路,每一步它都算数——考研政治老师孔昱力
展开
-
MMD以及核公式推导
文章目录Max Mean Discrepancy 最大均值差异MD均值差异最大均值差异(MMD)核函数Max Mean Discrepancy 最大均值差异MD均值差异判断两个分布p和q是否相同设:p分布生成样本空间Pq分布生成样本空间Q函数f输入:分布生成的样本空间若mean(f(P))==mean(f(Q))mean(f(P)) == mean(f(Q))mean(f(P))==mean(f(Q))则p和q是同一分布p中有样本p1, p2, …, pmq中有样本q原创 2022-01-18 00:30:39 · 3194 阅读 · 1 评论 -
模型评估指标
文章目录回归任务均方误差(mean squared error, MES)精度(accuracy)分类任务混淆矩阵模型整体效果:accuracy捕捉少数类的艺术:精确度、召回率和F1 score精确度(查准率、Precision)召回率(查全率、敏感度、真正率、Recall)F1 measure$\mathbf{F_\beta} $加权调和平均P-R曲线判错多数类的考量:特异度与假正率特异度(specificity)假正率(False Positive Rate, FPR)ROC曲线,AUC面积回归任务原创 2021-12-14 22:05:13 · 1030 阅读 · 0 评论 -
聚类、距离衡量方法
聚类分析目标:将数据样本划分为若干个通常不相交的“簇”,使簇内数据之间具有高的相似性,不同簇数据之间具有高的差异性一、相似性度量方法欧氏距离马氏距离标准化欧式距离海明距离哈曼顿距离杰卡德距离切比雪夫距离相关距离闵可夫斯基距离信息熵余弦距离基于核函数的度量1. 欧氏距离(欧几里得距离)两个向量α(x11,x12,…,x1n)\alpha\left(x_{11}, x_{12}, \ldots, x_{1 n}\right)α(x11原创 2021-12-13 12:32:36 · 3263 阅读 · 0 评论 -
激活函数选择
原创 2021-11-30 20:36:08 · 119 阅读 · 0 评论 -
图解 特征选择、特征提取的概念
更新时间:2021年9月15日特征选择对于某一项目,可能我们可以找出n多个特征(特征太多会影响训练时间),但是有的特征的确是效率不高。因此,我们需要取精华,弃糟粕。上述过程,每一个特征都有其实际的现实意义。但是,接下来说的特征提取,需要理解一下。特征提取特征提取的过程类似于压缩,不抛弃任何一个特征,通过算法对特征进行压缩。压缩之后的特征,无法赋予其实际意义,但是机器可以理解。...原创 2021-09-15 08:06:37 · 391 阅读 · 0 评论 -
模型与训练模型、参数(parameter)与超参数(hyperparameter)
模型与训练模型这个概念如果没有搞清楚,后面的一切都是空谈。我们每次使用一个训练集训练出一个“模型”,其实应该叫做训练模型。因为每次更换训练集,训练出的“模型”并不一样,即各个训练模型被训练出来的参数(系数)是不一样的。举个例子,我们在拟合一个y=ax+b的模型,第一个训练集训练的结果是y=x+0.9,第二个训练集训练的结果是y=x+1……因为我们不可能得到用于训练这个模型的所有数据,也就无法训练出使模型y=ax+b理论上100%正确的参数,所以我们只能得到不同的训练模型。参数(parameter)与超转载 2021-05-12 23:32:41 · 2333 阅读 · 0 评论