机器学习
calvinpaean
Carpe diem.
展开
-
用 Bootstrap 进行参数估计
1. 中心极限定理中心极限定理指的是给定一个任意分布的总体,每次从这个总体中随机抽样nnn个样本,一共抽取mmm次。然后把这mmm组抽样分别求出其平均值,这些平均值的分布接近正态分布。举个例子:现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。 然后,我们求出第一组的体重平均值、第二组的体重平...转载 2020-04-05 23:18:23 · 5108 阅读 · 0 评论 -
三次条样插值法
问题对于给出如下的离散数据点,现在想根据如下的数据点来推测x=5x=5x=5时的值,我们应该采用什么方法呢?xf(x)32.54.5172.590.5我们知道在平面上两个点确定一条直线,三个点确定一条抛物线(假设曲线的类型是抛物线),那么现在有四个点,我们很自然的会想到,既然两个点确定一条直线,那么最简单的方法就是,两个点之间连一条线,两个点...转载 2018-12-17 11:55:05 · 1179 阅读 · 0 评论 -
高斯过程 (Gaussian Process)
本博客转载自https://blog.csdn.net/u010016927/article/details/76856036**针对机器学习的高斯过程(Gaussian Process for Machine Learning,即GPML)**是一个通用的监督学习方法,主要被设计用来解决回归问题。它可以拓展为概率分类(probability classification),但是在当前的实现中,...转载 2018-12-11 15:17:45 · 5753 阅读 · 1 评论 -
Isolation Forest 论文学习
Abstract绝大多数现有的、基于模型的方法要想进行异常检测,都会构建出普通样本的轮廓,然后将那些不符合普通轮廓的样本识别为异常。这篇论文提出了一个不同的方法,直接将异常样本孤立出来,而不用去描述正常样本的轮廓。据我们所了解的,孤立的想法至今还没有被探索过。通过孤立,我们构建了本文的方法 — iForest 来探索下采样,该算法的时间复杂度是线性的,而且内存消耗也很低。实验评估显示,相对于AU...原创 2019-09-21 12:57:54 · 784 阅读 · 0 评论