机器学习错题集

 


1.线性分类器有三大类:感知器准则函数、SVM、Fisher准则,而贝叶斯分类器不是线性分类器。

感知器准则函数:代价函数J=-(W*X+w0),分类的准则是最小化代价函数。感知器是神经网络(NN)的基础,网上有很多介绍。

SVM:支持向量机也是很经典的算法,优化目标是最大化间隔(margin),又称最大间隔分类器,是一种典型的线性分类器。(使用核函数可解决非线性问题)

Fisher准则:更广泛的称呼是线性判别分析(LDA),将所有样本投影到一条远点出发的直线,使得同类样本距离尽可能小,不同类样本距离尽可能大,具体为最大化“广义瑞利商”。

贝叶斯分类器:一种基于统计方法的分类器,要求先了解样本的分布特点(高斯、指数等),所以使用起来限制很多。在满足一些特定条件下,其优化目标与线性分类器有相同结构(同方差高斯分布等),其余条件下不是线性分类


2.类概率密度与先验概率的乘积

所谓判别式模型,需要把正负样本区分开,那势必会遇到区分不开的情形,这时就要用到核函数了,那所以我认为判别式模型都要用核函数的。

Radial Basis Function
Linear Discrimimate Analysis
Support Vector Machine

HMM三大问题

A、B:前向、后向算法解决的是一个评估问题,即给定一个模型,求某特定观测序列的概率,用于评估该序列最匹配的模型。

C:Baum-Welch算法解决的是一个模型训练问题,即参数估计,是一种无监督的训练方法,主要通过EM迭代实现;

D:维特比算法解决的是给定 一个模型和某个特定的输出序列,求最可能产生这个输出的状态序列。如通过海藻变化(输出序列)来观测天气(状态序列),是预测问题,通信中的解码问题。


对于二类分类问题常用的评价指标是精准度(precision)与召回率(recall)。通常以关注的类为正类,其他类为负类,分类器在测试数据集上的预测或正确或不正确,4种情况出现的总数分别记作:

    TP——将正类预测为正类数

    FN——将正类预测为负类数

    FP——将负类预测为正类数

    TN——将负类预测为负类数

由此:

    精准率定义为:P = TP / (TP + FP)

    召回率定义为:R = TP / (TP + FN)

    F1值定义为: F1 = 2 P R / (P + R)

精准率和召回率和F1取值都在0和1之间,精准率和召回率高,F1值也会高,不存在数值越接近0越高的说法,应该是数值越接近1越高。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
ClickHouse是一个用于在线分析处理(OLAP)的列式数据库管理系统(DBMS),而机器学习是一种通过数据和算法训练模型来进行预测和决策的方法。那么如何将ClickHouse和机器学习结合起来呢? 首先,ClickHouse可以提供给机器学习训练数据的存储和查询。由于ClickHouse采用了列式存储和高并发查询的技术,可以有效地处理海量数据,为机器学习算法提供快速的数据访问能力。同时,ClickHouse支持SQL查询语言,可以方便地进行数据预处理、筛选和聚合操作,为机器学习算法提供优质的训练数据。 其次,ClickHouse的分布式架构也使得它适合处理机器学习任务。机器学习任务通常需要处理大规模的数据,而ClickHouse可以通过分布式部署实现更好的性能和可扩展性。通过将机器学习算法部署在ClickHouse群上,可以充分利用群的计算和存储资源,提高机器学习的处理速度和效果。 另外,ClickHouse还可以与机器学习框架或工具进行成,例如Apache Spark、TensorFlow等。通过将ClickHouse作为数据源,机器学习框架可以直接从ClickHouse中读取数据,进行模型训练和预测。这种成可以充分利用ClickHouse的高性能和机器学习框架的丰富功能,实现更复杂和高效的机器学习任务。 综上所述,ClickHouse与机器学习的结合可以通过提供高效的数据存储和查询、分布式计算能力以及与机器学习框架的成,为机器学习任务提供强大的支持。这样的结合将带来更高效、可扩展和丰富的机器学习应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值