自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

花花公子

中关村打工仔

  • 博客(11)
  • 资源 (7)
  • 收藏
  • 关注

转载 先验分布/后验分布/似然估计

image.png先验概率,后验概率,似然概率,条件概率,贝叶斯,最大似然似然函数,最大似然估计最大似然估计和最大后验概率估计的区别相信读完上文,MLE和MAP的区别应该是很清楚的了。MAP就是多个作为因子的先验概率P(θ)。或者,也可以反过来,认为MLE是把先验概率P(θ)认为等于1,即认为θ是均匀分布。详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的...

2019-05-16 19:57:00 761

转载 PCA学习与应用

一、PCA简介1. 相关背景主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。上完陈恩红老师的《机器学习与知识发现》和季海波老师的《矩阵代数》两门课之后,颇有体会。最近在做主成分分析和奇异值分解方面的项目,所以记录一下心得体会。在许多领域的...

2019-05-15 16:12:00 200

原创 最小二乘法矩阵形式推导

2019-05-10 14:46:35 9384

转载 最小二乘法推导

前言 普通最小二乘法(ordinary least squares,OLS)是线性回归预测问题中一个很重要的概念,在Introductory Econometrics A Modern Approach (Fourth Edition)第2章 简单回归模型 中,花了很详细的篇幅对此作出介绍。应聘数据挖掘岗位,就有考到对普通最小二乘法的推导证明。最小二乘法十分有用,例如可以用...

2019-05-10 14:26:13 26996

转载 Logistic回归推理过程

3. 具体过程3.1 构造预测函数Logistic Regression虽然名字里带“回归”,但是它实际上是一种分类方法,用于两分类问题(即输出只有两种)。根据第二章中的步骤,需要先找到一个预测函数(h),显然,该函数的输出必须是两个值(分别代表两个类别),所以利用了Logistic函数(或称为Sigmoid函数),函数形式为: 对应的函数图像是一个取值在0和1...

2019-05-09 13:42:16 489

原创 python DataFrame onehot编码,一列变多列

import pandas as pdcarria_code_dict={"CZ":0,"SC":1,"Y8":2,"3U":3,"MU":4,"NS":5}carria_len=carria_code_dict.__len__()def encode_data(str): datas=str.split(',') encode_result=['0']*carria_le...

2019-05-08 17:37:45 3685

原创 Wilcoxon ci_lower_bound 排序

PROBLEM: You are a web programmer. You have users. Your users rate stuff on your site. You want to put the highest-rated stuff at the top and lowest-rated at the bottom. You need some sort of “score” ...

2019-05-07 15:22:59 268

原创 置信区间和置信度

2019-05-07 14:58:01 1241

原创 WeakHashMap

要明白WeekHashMap的工作原理,还需要引入一个概念:弱引用(WeakReference)。我们都知道Java中内存是通过GC自动管理的,GC会在程序运行过程中自动判断哪些对象是可以被回收的,并在合适的时机进行内存释放。GC判断某个对象是否可被回收的依据是,是否有有效的引用指向该对象。如果没有有效引用指向该对象(基本意味着不存在访问该对象的方式),那么该对象就是可回收的。这里的“有效引用...

2019-05-06 20:30:09 145

原创 统计学P值

P 值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。统计学的观点,超过一定基准(比如 5%,其实是低于5%),就不能简单地认为这是偶然事件了,而是受到了外在的影响。数学大佬出来定义了一个称为值(p-value)的概念: 罗纳德·艾尔默·费希尔爵士(1890-1962)得到的就是(单侧P值):所以(双侧P值):如果扔10次出现出现8次正面:一...

2019-05-06 19:30:02 11148

原创 Java Proxy动态代理

动态代理在Java中有着广泛的应用,比如Spring AOP、RPC,Java注解对象获取等。hadoop 远程调用也采用socket+java动态代理实现。首先实现一个InvocationHandler,方法调用会被转发到该类的invoke()方法。 然后在需要使用Hello的时候,通过JDK动态代理获取Hello的代理对象。 上述代码的关键是Proxy.newProxyInsta...

2019-05-05 19:50:14 142

美团-机器学习-实践_最新AI算法实践真知

美团-机器学习-实践_最新AI算法实践真知 人工智能技术正以一种超快的速度深刻地改变着我们的生活,引导了第四次工业革命。美团作为国内O2O领域领 先的服务平台,结合自身的业务场景和数据,积极进行了人工智能领域的应用探索。在美团的搜索、推荐、计算广告、风控、图像处理等领域,相关的人工智能技术得到广泛的应用。本书包括通用流程、数据挖掘、搜索和推荐、计算广告、深度学习以及算法工程6大部分内容,全面介绍了美团在多个重要方面对机器学习的应用。 本书非常适合有一定机器学习基础的工程技术人员和在校大学生学习和阅读。通过本书,有经验的算法工程师可以了解美团在这方面的做法,在校大学生可以学习机器学习算法如何在具体的业务场景中落地。

2018-11-22

elasticsearch-the-definitive-guide-cn

elasticsearch-the-definitive-guide-cn Elasticsearch权威指南(中文版)

2018-08-22

hive调优总结文档-hive tuning ppt

hive调优总结,网络上分享的hive常见优化细节,join、shuffle优化等等。很不错

2018-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除