机器学习的一些基本概念

数据集data set:一系列记录的集合

示例instance、样本sample:每条记录是关于一个事件或对象的描述

属性attribute、特征feature:反应事件或对象在某方面的表现或性质的事项

属性值attribute value:属性上的取值

属性空间attribute space、样本空间sample space、输入空间:各个属性不同值组成的空间

特征向量feature vector:一个示例在每个属性上的取值可以考虑为一个向量

机器学习算法machine learning algorithm:由输入数据集到输入标记的一个函数映射y=f(x)

分类classification:预测目标(y)为离散值

回归regression:预测目标(y)为连续值

聚类clustering:事先不知道类别标签,按照一定原则将输入数据分为若干组,物以类聚人以群分

有监督学习supervised learning:训练数据拥有标记信息

无监督学习unsupervised learning:训练数据无标记信息

半监督学习Semi-supervised learning:少量数据有标记,大量数据未标记

强化学习reinforcement learning:输入状态、动作、奖励输出方案

泛化能力generalization:机器学习的目标是使学得的模型能很好的适用于新样本(未知类别标记的样本),而不仅仅是在训练样本上工作做得很好,学得模型适用于新样本的能力称为泛化能力

归纳induction:由特殊到一般的泛化generalization过程

演绎deduction:由一般到特殊的特化specialization过程


训练集train set、训练标签train label:已有y(train label)的x(train set)用于训练我们的f

测试集test set、测试标签test label:用于检测模型的泛化能力

验证集:没有标记的样本集合,用于实际使用模型

训练模型fit:我们把算法学习过程看作一个在所有假设hypothesis组成的空间进行搜索的过程,搜索目标是找到与训练集匹配的假设

归纳偏好inductive bias:机器学习算法在学习过程中对某种类型假设的偏好。任何一个有效的机器学习算法必有其归纳偏好,否则它将被假设空间中看似在训练集上等效的假设所迷惑,而无法产生确定的学习结果

奥卡姆剃刀原则Occam`s razor:若有多个假设(模型)与观测(训练集的分布)一致,则选择最简单的那个

没有免费的午餐定理no free lunch theorem:任何算法在样本空间全集上的期望性能完全相同

版权所有,转载请注明出处

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
软件介绍 伴随着网络的发展,也产生了各种各样的安全问题,服务器被入侵、木马后门及垃圾病毒挂马肆意泛滥,木马无孔不入,DDoS攻击越来越常见,黑客攻击行为几乎每时每刻都在发生。如何及时的、准确的发现违反安全策略的事件,并及时处理,是广大企业用户迫切需要解决的问题。 云顿服务器安全加固系统(eisafe safety system server,简称:eisafe safety) 是云顿科技自主知识产权的安全产品,它是对服务器安全有效加固、全自动安全加固、一键设置执行处理,从而有效的保护WEB服务器、避免黑客入侵、安全加固一体化解决方案。 云顿服务器安全加固系统是安全加固系统同类产品中的经典之作,该产品拥有业界其它产品无以比拟的高性能、高安全性、高可靠性和易操作性等特性,为用户带来了极佳的安全体验。 系统危险文件加固设置权限 eisafe safety对windows系统核心文件加固权限,去除危险用户访问权限,防止非法用户利用系统文件进行攻击。 系统危险文件夹权限加固 eisafe safety对windows系统核心文件夹进行加固,去除危险文件夹非本地用户访问。 系统危险服务优化 禁止和关闭危险服务启动,并对服务进行优化,提供服务器运行速度。 系统危险组件及注册表加固 关闭和卸载危险组件,防止WEB进行恶意调用,如内核执行DOS、远程提权用户等危险组件。 Ddos防御注册表加固 对DDOS防御进行注册表简单加固,可防止小部分攻击。 每天定时重启-时间5点 每天定时重启服务有效的清理缓存垃圾,维护服务器顺畅运行。 Tags: 服务器安全 服务器设置 加固
因果机器学习(Causal Machine Learning)是机器学习领域的一个分支,它关注的是从数据中识别和理解因果关系,而非仅仅描述关联。在传统的统计机器学习中,我们通常处理的是关联性数据,即观测到的现象之间的相关性。然而,因果机器学习更进一步,试图揭示事件之间的因果链,比如某个变量的变化是如何直接或间接地导致其他变量变化的。 因果机器学习基本概念包括: 1. **潜在原因(Latent Causes)**:这些是未观察到但可能影响结果的因素,通过寻找它们,我们可以推断出真正的因果影响。 2. **潜在干预(Latent Interventions)**:模拟现实世界中的干预,比如改变某个变量的值,来探究假设中的因果关系。 3. **do-notation(do操作符)**:这是一种在表达式中插入的符号,用于表示对系统进行干预的假设,如 "do(X=x)" 表示将变量 X 设置为 x。 4. **无偏估计(Unbiased Estimation)**:因果推断需要确保估计量在干预后的效果上是无偏的,这是评估因果模型的关键。 5. **工具变量(Instrumental Variables)**:当直接的因果路径难以识别时,可以使用与目标变量有因果关系但与混淆变量不相关的变量作为中介。 6. **双射学习(Structural Causal Models, SCM)**:这是一种用图形表示因果关系的方式,包含了系统的结构方程和变量之间的因果关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值