自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习(统计学习方法)基础知识

统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。统计学习也称为统计机器学习(statistial machine learning)。统计学习分为监督学习,非监督学习,半监督学习和强化学习。本文内容以监督学习为主。 实现统计学习方法的步骤如下: 1) 得到一个有限的训练数据集合; 2) 确定包含所有可能的模型的...

2018-08-30 18:14:22 6473

原创 强化学习中常用的随机策略

随机策略可以理解为是概率分布,常用的有以下几种:贪婪策略π∗(a|s)={1  if a=arga∈Amaxq∗(s,a)0  otherwiseπ∗(a|s)={1  if a=arga∈Amaxq∗(s,a)0  otherwise\pi_*(a|s)=\begin{cases}1  if a=arg_{a \in A} max q_*(s,a)\\0  otherwise\\...

2018-08-21 16:14:32 9666 2

原创 强化学习之无模型方法二:时间差分

时间差分方法(TD)是强化学习中最核心的也是最新奇的方法,混合了动态规划(DP)和蒙特卡洛方法(MC) - 和MC类似,TD从历史经验中学习 - 和MDP类似,使用后继状态的值函数更新当前状态的值函数TD属于无模型方法,未知P和R,同时应用了采样和贝尔曼方程,可以从不完整的片段中学习,通过估计来更新估计时间差分评价时间差分策略评价算法目的:给定策略ππ\pi,求其对应的...

2018-08-14 23:51:55 3396

原创 Spark学习笔记(合集)

Part1:RDD操作 Part2:RDD键对操作 Part3:数据读取与保存 Part4:Spark进阶编程 Part5:集群运行Spark Part6:Spark调优与调试 Part7:Spark SQL

2018-08-03 14:47:01 746

转载 Markdown 语法攻略

参考: 1. https://www.zybuluo.com/codeep/note/163962 2. https://blog.csdn.net/qq_37656398/article/details/79308997 3. https://www.jianshu.com/p/a0aa94ef8ab2 4. https://blog.csdn.net/zdk930519/article...

2018-08-03 14:32:03 175

原创 FM系列算法解读(FM+FFM+DeepFM)

https://blog.csdn.net/jiangjiang_jian/article/details/80631180

2018-08-03 14:27:24 74570 3

原创 FTRL算法

概述GBDT算法是业界比较好用筛选特征的算法,在线学习考虑效率和数据量,经常用GBDT离线筛选特征,输入到在线模型进行实时训练,如今比较好用的方法有两个:FTRL和FM,下面将深入介绍各自的原理以及应用的案例离线特征筛选:GBDT线上模型(1):FTRL点击率预估(CTR)问题是计算广告中非常重要的模块,通过预估用户对广告的点击概率来对广告进行排序,进而提升广告效果和收益效率。对于...

2018-08-01 14:27:53 6667

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除