LAMP
文章平均质量分 75
panthera_1
这个作者很懒,什么都没留下…
展开
-
deep|Bayes(1)
本次汇报内容是三星研究所的一个关于贝叶斯和深度学习的课程,主要内容有贝叶斯框架对ML问题的unified formalism和方法(学习表示,强化学习,正则化,生成时模型,高斯过程),现存的深度学习算法基于贝叶斯解释而拓展应用范围(Dropout,GANs,自编码器),一些提高算法扩展的数学工具(随机优化,方差减少,双随机变分推理,可扩展MCMC算法) 贝叶斯定理贝叶斯定理;原创 2018-10-15 21:28:41 · 281 阅读 · 0 评论 -
话题模型
自然语言处理 自然语言处理(英语:Natural Language Processing,缩写为NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分。 自然语言认知和理解是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。让AI理解人类,应用有理解意图,解析语义,识别...原创 2018-12-19 15:13:19 · 1616 阅读 · 0 评论 -
yisa 杯教训
果然还是实战经验太少,有些坑是绕不过去的。1.模型验证集要针对真实情况,尽量还原测试环境(测试步骤、数据类型、特征选择)2.要将训练集和测试集放到一起来进行特征提取,失败的关键所在3.多想相关资料https://blog.csdn.net/gusui7202/article/details/82991730train_im.py机器学习&图像处理常用的特征汇...原创 2018-12-12 15:50:39 · 180 阅读 · 0 评论 -
AML 3
第十章 降维与度量学习K近邻学习器(k-Nearest Neighbor,kNN)是懒惰学习(lazy learning)的代表 投票法、平均法最近邻学习器和贝叶斯最优分类器:给定的测试样本x,若其最近邻样本为z,则其最近邻分类器出错的概率就是x和z类别标记不同的概率。Perr=1-c∈YPcxPcz.维数灾难 高维空间给距离计算带来很大的麻烦。在高维情形下出现的数据样本稀...原创 2018-11-19 20:22:09 · 264 阅读 · 0 评论 -
AML 2
AML 2 典型方法线性模型,通过属性的线性组合来进行预测的函数fx=wTx+b,简单,基本,可理解性好广义线性模型,y=g-1wTx+b,g-1单调可微的联系函数。支持向量机,将训练样本分开的超平面的 线性分类器 正中间的最好。鲁棒性最好,泛化能力最强。超平面方程:wTx+b=0找到参数w和b 使得r最大,argmax2||w||, s.t. yiwTxi+b≥1 ,I =1...原创 2018-11-16 15:42:51 · 352 阅读 · 0 评论 -
AML01
AML 1计算学习理论,PAC(probably approximately correct,概率近似正确)learning model Pfx-y<ϵ≥1-δfx-y<ϵ泛化误差尽可能小于ϵ ,PEh<ϵ≥1-δ尽可能正确,以较大的概率学的误差满足预设上限的模型。归纳偏好(inductive bias)一般原则:奥卡姆剃刀(Ocam’s razor...原创 2018-11-16 11:14:09 · 258 阅读 · 0 评论 -
10.24笔记
机器学习方法也是算法4、5类监督学习(神经网络)、无监督学习、半监督学习(semi-supervised learning)、强化学习、遗传算法(模拟进化理论)人工神经网路 vs 生物神经网络模拟生物的神经网络,但不是生物神经网络神经网络在外界信息的基础上改造自身,对输入和输出进行建模一种运算模型,大量节点如人类的神经元能训练和强化输入层----隐藏...原创 2018-10-25 08:12:12 · 161 阅读 · 0 评论 -
deep|Bayes(4)
LDA模型VAEGANs强化学习贝叶斯神经网络贝叶斯Logistic 参考文献原创 2018-10-17 16:54:04 · 241 阅读 · 0 评论 -
deep|Bayes(3)
前面说EM算法的时候讲到EM算法可看做一种非梯度优化方法,旨在计算对数似然函数在隐变量后验概率下的期望。一方面,很多时候在计算时涉及形式非常复杂的积分或求和,往往无法直接得到解析解;另一方面要积分的变量空间可能有很高的维度,这样就使得精确付出的代价很高,因此在现实应用中,近似计算是个很好的选择。而近似计算有两大类:第一类是采样,通过使用随机方法完成近似,如MCMC采样;第二类则是使用确定性近似完成...原创 2018-10-16 21:22:17 · 311 阅读 · 0 评论 -
deep|Bayes(2)
隐变量模型 对象真实特征的不可量化的变量现实不存在,在模型中存在且起作用三硬币模型混合高斯模型EM算法•一种数据添加算法•当前科学研究以及各方面实际应用中数据量越来越大•算法简单,稳定上升的步骤能非常可靠地找到“最优的收敛值”•数据添加技术,所添加的数据通常被称为“潜在数据”步骤:已知:样本X 其中有m个独立样本,,样本中的类别未知即Z未知求:估...原创 2018-10-16 11:32:19 · 658 阅读 · 0 评论 -
SWIM论文
Synthetic oversampling with the majority class: A new perspective on handling extreme imbalance多数派综合抽样:处理极端失衡的新视角摘要:不平衡问题是现实世界的普遍问题,当前解决不平衡问题最流行的方法是通过过采样方法生成合成数据来增加少数类。但是,他们将注意力集中在少数类的特征上,并使用他们来...原创 2018-12-10 15:01:38 · 752 阅读 · 1 评论